День 8. Арифметические и логические инструкции

День 8. Арифметические и логические инструкции — Лисья нора

Главная » Процессор x86 » День 8. Арифметические и логические инструкции

§ Введение

Пожалуй, это одна из обширных тем для процессора, поскольку именно этим процессор и должен заниматься - это вычислением. Существуют 8 базовых арифметически-логических операций для 8 ил 16, 32, 64 разрядностей. Для 8086 доступны только 8 и 16.

ADD - Сложение двух чисел
ADC - Сложение чисел с учетом переноса (флаг C)
SUB - Вычитание
SBB - Вычитание с переносом
AND - Логическое И
XOR - Логическое Исключающее ИЛИ
OR - Логическое ИЛИ
CMP - Сравнение, которое на самом деле тоже самое что и SUB

Для расчетов я напишу одну функцию, которая будет этим заниматься. Ее прототип:

1uint16_t arithlogic(char id, char i_w, uint16_t op1, uint16_t op2);

Номера

Принимает на вход ID - номер функции (0-ADD, 1-OR и т.д.); параметр i_w - это битность, либо 0 (8 бит), либо 1 (16 бит); два операнда op1, op2.

Также надо создать вспомогательную функцию, которая будет подсчитывать четность в результате.

1uint8_t parity(uint8_t b) {
2
3    b = (b >> 4) ^ (b & 15);
4    b = (b >> 2) ^ (b & 3);
5    b = (b >> 1) ^ (b & 1);
6    return !b;
7}

Номера

Четность будет рассчитана только для 8 битного результата, то есть, только для младшего байта любого результата. Что такое четность? Если PF=1, это значит, что количество единичных битов четно, если PF=0, то нет. К примеру 01100011 чётно, потому что тут 4 бита, а 01011011 нечетно, т.к. тут 5 битов.

Как работает эта инструкция? Очень просто: используются свойства исключающего ИЛИ для пересчета четности. Сначала складывается бит 0 с битом 4, 1 с 5, 2 с 6 и 3 с 7, получается 4 битное число. Потом складываются биты 0 с 2, 1 с 3, получается 2 битное число, и наконец 0 складывается 1. Если получилось 0, это значит, что все парные биты друг друга погасили, если 1 - то нет. То есть при 0 число имеет четное количество бит.

§ Общий вид функции вычисления

Вычисление АЛУ двух чисел 8 (i_w=0) или 16 бит (i_w=1)

0 ADD = op1 + op2
1 OR = op1 | op2
2 ADC = op1 + op2 + CF
3 SBB = op1 - op2 - CF
4 AND = op1 & op2
5 SUB = op1 - op2
6 XOR = op1 ^ op2
7 CMP = op1 - op2

1uint16_t arithlogic(char id, char i_w, uint16_t op1, uint16_t op2) {
2
3    uint32_t res = 0;
4
5    // Расчет битности
6    int bits = i_w ? 0x08000 : 0x080;
7    int bitw = i_w ? 0x0FFFF : 0x0FF;
8    int bitc = i_w ? 0x10000 : 0x100;
9
10    op1 &= bitw;
11    op2 &= bitw;
12
13    // Выбор режима работы
14    switch (id) {
15
16        case 0: break; // ADD
17        // ...
18    }
19
20    // Эти флаги проставляются для всех
21    flags.p = parity(res);
22    flags.z = !(res & bitw);
23    flags.s = !!(res & bits);
24
25    return res & bitw;
26}

Номера

В этом коде res представляется 32-х битным числом потому, что иногда результат может превышать пределы 16 битного значения, а такие случаи необходимо отмечать в флаге CF. Также здесь рассчитываются некоторые вспомогательные маски: bits - это маска старшего бита в результате, bitw - маска значащих битов (их либо 16, либо 8), bitc - бит, где будет обнаруживаться перенос.

После исполнения арифметической или логической операции в конце ставятся 3 бита S,Z,P. Причем они ставятся при любом выбранном id. Бит P высчитывает четность результата, Z ставится в 1, если результат ноль, и S - если старший бит результата единица (или знак минус в дополненном коде).

И наконец, в конце возвращается число с учетом нужной битности, которая ограничена через bitw.

§ Переполнение

Это один из самых странных и трудных вопросов, на который не так и легко дать ответ. Начнем с переполнения при сложении. Что такое переполнение? Это случай, когда число определенного знака не помещается в разрядность. Например для байта 127 + 1 должно дать по идее, 128, и это так, но дело в том, что 0x80 это уже знаковое число, которое равно -128. То есть, произошло переполнение знака, и вместо 128 появилось -128. Или если сложить 127 + 2, то получим не 129, а -127, опять знак с + поменялся на -, переполнение.

Переполнения при сложении не может быть, если складываются числа с разным знаком. Переполнения не может быть, так как, чтобы это случилось, нужно чтобы число преодолело барьер знака, но разные знаки будут только отдалять от этой границы. Если интересно, можно попробовать самому не найти решения такой задачи.

Итак, при сложении переполнение может быть только с одинаковыми знаками. То есть когда положительное число плюс положительное дает отрицательное, и наоборот, когда отрицательное + отрицательное дает положительное. Получаем таблицу истинности:

A B R
0 0 1 Плюс + Плюс = Минус
1 1 0 Минус + Минус = Плюс

С вычитанием наоборот, одинаковые знаки операнда никак не могут дать переполнения, здесь переполнение дают только разные знаки. Если вычитание отрицательного из положительного дает отрицательное, то это переполнение. И наоборот.

A B R
0 1 1 Плюс - Минус = Минус
1 0 0 Минус - Плюс = Плюс

§ Код вычислений

Ниже приведен код, который, как оказалось, не такой уж и большой, как я предполагал.

1switch (id) {
2
3    case 0: // ADD
4    case 2: // ADC
5
6        res = op1 + op2;
7
8        // Если это ADC, добавляется флаг CF
9        if (id == 2) res += !!flags.c;
10
11        flags.c = !!(res & bitc);
12        flags.a = !!((op1 ^ op2 ^ res) & 0x10);
13        flags.o = !!((op1 ^ op2 ^ bits) & (op1 ^ res) & bits);
14        break;
15
16    case 3: // SBB
17    case 5: // SUB
18    case 7: // CMP
19
20        res = op1 - op2;
21
22        // Если это SBB, вычитается флаг CF
23        if (id == 3) res -= !!flags.c;
24
25        flags.c = !!(res & bitc);
26        flags.a = !!((op1 ^ op2 ^ res) & 0x10);
27        flags.o = !!((op1 ^ op2) & (op1 ^ res) & bits);
28        break;
29
30    case 1: // OR
31    case 4: // AND
32    case 6: // XOR
33
34        if (id == 1) res = op1 | op2;
35        if (id == 4) res = op1 & op2;
36        if (id == 6) res = op1 ^ op2;
37
38        flags.c = 0;
39        flags.a = !!(res & 0x10); // Unknown
40        flags.o = 0;
41        break;
42}

Номера

Выбирается режим работы, от 0 до 7. Здесь порядок расположения кодов инструкции не просто так - ровно такой же порядок под теми же номерами в процессоре. Рассмотрим инструкции сложения, они очень простые: складывается op1 + op2, и если это инструкция ADC (номер 2), то еще добавляется флаг CF к результату. Потом считаются флаги:

C - устанавливается, когда результат достиг переноса (установлен 8-й или 16-й бит)
A - ставится 1, если при сложении нижних 4-х битов получился перенос в 5-й бит
O - флаг переполнения ставится при знаковом переполнении старшего бита

Теперь насчет флага A, этот флаг отвечает за перенос бита с 3-го на 4-й разряд. Как оно работает, op1^op2 - это обычная схема полусумматора, который складывает 4-й бит, и если в результате res 4-й бит равен op1^op2, то получается 0, т.е. (op1^op2^res) и проверяется 4-й бит & 0x10. Если это так, то никакого переноса точно не было. Если же там 1, это значит, что предполагаемый результат и реальный результат различаются - это значит только то, что перенос есть. Это работает также и с операцией SUB, SBB.

Флаг переполнения ставится тогда, если старшие биты op1, op2 одинаковые, а res отличается. Если op1, op2 биты одинаковые, то op1^op2^res дает неотрицательный результат, иначе - ноль. Если же биты op1 и res отличаются, то op1^res в старшем бите даст 1, что даст overflow=1

Давайте теперь рассмотрим SUB, SBB, CMP. Сразу можно сказать, что SUB это тоже самое что и CMP. SBB отличается от SUB тем, что вычитается еще и флаг CF из результата. Флаги AF и CF выставляются аналогично флагам для ADD, ADC. Для флага OF меняется только разве что то, что бит op1^op2 не инвертируется, т.е. если старшие биты не равны, то op1^op2 дает 1, и если бит именно op1 не равен биту res, то в таком случае засчитывается переполнение.

С AND, XOR и OR все элементарно и видно из кода, что OF = 0, CF = 0 всегда, а флаг AF не определен. Для пущей аутентичности я сделал так, что он копирует бит 4 из AF. Все равно неясно как на реальной машине это работает. Надо проверить бы.

§ Базовые инструкции АЛУ

А теперь приступаем к самому главному - к инструкциям. Я буду рассматривать инструкции в диапазоне опкодов $00-$3F.

Для начала надо дописать вспомогательные функции

1// Получение значения регистра из ModRM
2uint16_t get_reg(int i_w) { return i_w ? regs16[i_reg] : regs[REG8(i_reg)]; }
3
4// Сохранение в регистр
5void put_reg(int i_w, uint16_t data) {
6
7    if (i_w) regs16[i_reg] = data;
8    else     regs[REG8(i_reg)] = data;
9}

Номера

Эти функции позволяют записывать обратно в регистр, полученный через сканирование modrm. Здесь читается или записывается в регистры в зависимости от выбранного размера - 8 или 16 бит.

1// Базовые инструкции АЛУ
2case 0x00: case 0x01: case 0x02: case 0x03: // ADD modrm
3case 0x08: case 0x09: case 0x0A: case 0x0B: // OR  modrm
4case 0x10: case 0x11: case 0x12: case 0x13: // ADC modrm
5case 0x18: case 0x19: case 0x1A: case 0x1B: // SBB modrm
6case 0x20: case 0x21: case 0x22: case 0x23: // AND modrm
7case 0x28: case 0x29: case 0x2A: case 0x2B: // SUB modrm
8case 0x30: case 0x31: case 0x32: case 0x33: // XOR modrm
9case 0x38: case 0x39: case 0x3A: case 0x3B: // CMP modrm
10
11    i_sel  = (opcode_id & 0x38) >> 3; // Режим работы АЛУ
12    i_dir  = !!(opcode_id & 2); // Направление
13    i_size = opcode_id & 1; // Размер byte | word
14
15    // rm, r или r, rm
16    i_op1  = i_dir ? get_reg(i_size) : get_rm(i_size);
17    i_op2  = i_dir ? get_rm(i_size)  : get_reg(i_size);
18
19    // Вычисление операндов
20    i_res  = arithlogic(i_sel, i_size, i_op1, i_op2);
21
22    // Запись результата обратно в регистр или в память
23    if (i_sel != ALU_CMP) {
24
25        if (i_dir) put_reg(i_size, i_res);
26            else   put_rm(i_size, i_res);
27    }
28
29    break;

Номера

Здесь описаны 32 инструкции для АЛУ, которые работают с байтом modrm.

i_sel - из опкода выбираются биты 3..5, которые отвечают за номер режима АЛУ
i_dir - если =0, то первым операндом выступает r/m, вторым reg-часть, если =1 то наоборот, reg, r/m
i_size - если 0, то 8 бит, если 1, то 16 бит (или 32)
i_op1 и i_op2 - читаются операнды из памяти или регистров в соответствии с i_dir, i_size
i_res - вычисляется итоговый результат

После всех вычислений записывается результат. Если i_dir=1, то результат пишется исключительно в 8/16-регистр, если i_dir=0, то либо в память, либо регистр. Причем если это CMP-инструкция, то результат записан не будет.

1// Базовые АЛУ с AL/AX
2case 0x04: case 0x05: case 0x0C: case 0x0D: // ADD | OR
3case 0x14: case 0x15: case 0x1C: case 0x1D: // ADC | SBB
4case 0x24: case 0x25: case 0x2C: case 0x2D: // AND | SUB
5case 0x34: case 0x35: case 0x3C: case 0x3D: // XOR | CMP
6
7    // Режим работы АЛУ
8    i_sel  = (opcode_id & 0x38) >> 3;
9    i_size = opcode_id & 1;
10
11    // Операнды
12    i_op1  = i_size ? regs16[REG_AX] : regs[REG_AL]; // AL, AX
13    i_op2  = fetch(i_size + 1); // 1 или 2 байта
14
15    // Вычисление
16    i_res  = arithlogic(i_sel, i_size, i_op1, i_op2);
17
18    if (i_sel != ALU_CMP) {
19
20        if (i_size) regs16[REG_AX] = i_res;
21               else regs[REG_AL] = i_res;
22    }
23
24    break;

Номера

Это те же базовые инструкции, где выбор режима работы i_sel точно такой же, как и i_size, но отличается тем, что в качестве первого операнда выступает AL или AX, а в качества второго операнда непосредственное значение, идущее за опкодом (1 или 2 байта). CMP не сохраняет в регистр AL или AX новое значение.

§ INC, DEC

Инструкции INC и DEC это тоже самое, что и ADD, SUB с вторым операндом, равным 1, и с сохранением старого значения флага.

1// INC r16
2case 0x40: case 0x41: case 0x42: case 0x43:
3case 0x44: case 0x45: case 0x46: case 0x47:
4// DEC r16
5case 0x48: case 0x49: case 0x4A: case 0x4B:
6case 0x4C: case 0x4D: case 0x4E: case 0x4F:
7
8    old_cf = flags.c;
9    i_op1 = regs16[opcode_id & 7];
10    regs16[opcode_id & 7] = arithlogic(opcode_id & 8 ? ALU_SUB : ALU_ADD, 1, i_op1, 1);
11    flags.c = old_cf;
12    break;

Номера

В зависимости от бита 3 в опкоде меняется операция ADD на SUB. Бит CF сохранен. Номер регистра содержится в нижних 3 битах 0..2.

Помимо базового набора, INC и DEC располагается также в групповых инструкциях

1case 0xFE: // Групповая инструкция #4
2
3    switch (i_reg) {
4
5        case 0: // INC rm8
6        case 1: // DEC rm8
7
8            i_op1   = get_rm(0);
9            old_cf  = flags.c;
10            put_rm(0, arithlogic(i_reg ? ALU_SUB : ALU_ADD, 0, i_op1, 1));
11            flags.c = old_cf;
12            break;
13    }
14
15    break;

Номера

Этот код описывает работу с 8 битной групповой инструкцией. Получается 8 битный операнд, выполняется сложение или вычитание с сохранением старого флага, и обратно сохраняется в память или регистр результат.

1case 0xFF:
2
3    switch (i_reg) {
4
5        case 0: // INC rm8
6        case 1: // DEC rm8
7
8            i_op1   = get_rm(1);
9            old_cf  = flags.c;
10            put_rm(1, arithlogic(i_reg ? ALU_SUB : ALU_ADD, 1, i_op1, 1));
11            flags.c = old_cf;
12            break;
13        // ...
14   }

Номера

Для 16-битных операции используется групповая инструкция 0xFFh, где код аналогичен тому, что и 8 бит, просто поменялась разрядность.

§ Групповые инструкции АЛУ

Также в наборе x86 существует 4 опкода, которые выполняют инструкции в зависимости от заданного значения reg-части в байте modrm. Сначала декодируется modrm, получается операнд rm, который и будет использоваться в качестве первого операнда, потом получается второй операнд путем считывания непосредственного значения.

1case 0x80: case 0x82: // alu rm, i8
2case 0x81: // alu rm, i16
3case 0x83: // alu rm16, i8
4
5    i_size = opcode_id & 1;
6    i_op2  = opcode_id == 0x81 ? fetch(2) : fetch(1);
7
8    // Знаковое расширение для 0x83 инструкции
9    if (opcode_id == 0x83 && (i_op2 & 0x80)) i_op2 |= 0xFF00;
10
11    // Вычисление
12    i_res = arithlogic(i_reg, i_size, get_rm(i_size), i_op2);
13
14    // Сохранение результата
15    if (i_reg != ALU_CMP) put_rm(i_size, i_res);
16    break;

Номера

Выбор размера операнда i_size как и обычно, через младший бит опкода, а вот выбор размера операнда для непосредственного значения немного другой. 16-битное число будет прочитано только тогда, когда опкод будет равным 0x81. Для опкода 0x83 происходит знаковое расширение. То есть будет прочитан 1 байт, но если в его старшем бите 1, то вся старшая часть второго операнда выставится в FFh. Далее все происходит как обычно до этого, выбирается режим работы АЛУ i_reg, указывается i_size, читается первый операнд и указывается второй. Если CMP, то результат обратно не пишется.

§ TEST

В процессорном наборе инструкции существует такая инструкция как TEST - полный аналог инструкции AND за исключением того, что сохраняются только флаги, а сам результат нет.

1case 0x84: case 0x85: // TEST rm, r
2
3    i_size = opcode_id & 1;
4    arithlogic(ALU_AND, i_size, get_rm(i_size), get_reg(i_size));
5    break;

Номера

Также есть вариант с непосредственным операндом совместно с аккумулятором:

1case 0xA8: case 0xA9: // TEST A, i8
2
3    i_size = opcode_id & 1;
4    i_op1  = i_size ? regs16[REG_AX] : regs[REG8(REG_AL)];
5    i_op2  = fetch(1 + i_size);
6    arithlogic(ALU_AND, i_size, i_op1, i_op2);
7    break;

Номера

Еще TEST присутствует в групповых инструкциях F6, F7, о которых речь далее.

§ Групповые инструкции F6h, F7h

В групповых однооперандных также находится TEST, который получает в качестве второго операнда непосредственный операнд 8 или 16 бит.

1case 0xF6:
2case 0xF7:
3
4    switch (i_reg) {
5
6        case 0:
7        case 1: // TEST rm, i8
8
9            i_size = opcode_id & 1;
10            i_op1  = get_rm(i_size);
11            i_op2  = fetch(1 + i_size);
12            arithlogic(ALU_AND, i_size, i_op1, i_op2);
13            break;
14    }
15
16    break;

Номера

Интересная особенность заключается в том, что по какой-то причине TEST занимает 0 и 1 код инструкции i_reg. Это особенность архитектуры x86, вероятно, какой-то баг.

§ NOT

Операция NOT работает элементарно:

1case 2: // NOT (i_reg=2)
2
3    i_size = opcode_id & 1;
4    put_rm(i_size, ~get_rm(i_size));
5    break;

Номера

Берется операнд rm, инвертируются биты и записывается в память или регистр обратно с нужной разряднстью.

§ NEG

Операция NEG равнозначна вычитанию операнда из нуля.

1case 3: // NEG (i_reg=3)
2
3    i_size = opcode_id & 1;
4    put_rm(i_size, arithlogic(ALU_SUB, i_size, 0, get_rm(i_size)));
5    break;

Номера

Как и в NOT, данные для операнда берутся из rm-части modrm, потом обратно записываются после вычитания из 0.

На этом всё, я разобрал все базовые простые арифметические инструкции. Дополнительно к этим инструкциям, есть еще MUL, DIV, IMUL и IDIV, они будут рассмотрены позже.

Код, как обычно, прикреплен здесь.
Следующий материал