§ MOV r, imm
Сегодня разберем инструкции, которые занимаются, собственно, перемещением данных. Начну я, пожалуй, с самого интересного, это базовых инструкции загрузки непосредственного операнда в регистры 8 или 16 битные. Причем интересный факт: существуют также копии таких инструкции, но выполнены они в другом виде, в более компактном и не занимающим место в слотах операндов. О них будет рассказано позже. А сейчас код.// MOV r16, imm16 case 0xB8: case 0xB9: case 0xBA: case 0xBB: case 0xBC: case 0xBD: case 0xBE: case 0xBF: regs16[ opcode_id & 7 ] = fetch(2); break;Как видим, код простой до невозможности. Просто читаются следующие 2 байта и засылается в необходимый нам регистр, который содержится в 3-х младших бита опкода.
Поскольку последовательность такая AL, CL, DL, BL, AH, CH, DH, BH, а регистры хранятся в таком виде в памяти AL, AH, CL, CH, DL, DH, BL, BH, то придется сделать иначе с 8-битным представлением.
case 0xB0: case 0xB1: case 0xB2: case 0xB3: case 0xB4: case 0xB5: case 0xB6: case 0xB7: // 100 -> 001 | 011 --> 110 Меняются местами regs[ ((opcode_id & 4) >> 2) | ((opcode_id & 3) << 1) ] = fetch(1); break;Эта хитрость направлена на то, чтобы записать в правильную ячейку памяти regs, поскольку там память организована иначе. Дело в том что 2-й бит opcode_id отвечает за либо старший байт, либо за младший байт, а старший и младший байт адресуются битом 0, поэтому бит 2 двигается в бит 0. А биты 1:0 двигаются в биты 2:1, тем самым приводя всё в порядок.
§ MOV rm, imm
Код для этих инструкции простой// MOV rm, i8/16 case 0xC6: put_rm(0, fetch(1)); break; case 0xC7: put_rm(1, fetch(2)); break;Для MOV rm8, imm8 считывается 1 байт, и записывается в rm-часть, которая указана была в байте modrm. Запись может происходить не только в память, но еще и в регистр. Так же работает инструкция MOV rm16, imm16, просто с другой разрядностью (16 бит).
§ MOV rm | rm
Следующая группа инструкции занимается тем, что пересылает из памяти в регистр или наоборотcase 0x88: put_rm(0, regs[REG8(i_reg)]); break; case 0x89: put_rm(1, regs16[i_reg]); break; case 0x8A: regs[REG8(i_reg)] = get_rm(0); break; case 0x8B: regs16[i_reg] = get_rm(1); break;Здесь используются функции put_rm и get_rm, которые записывают или читают данные в соответствии с тем, что находится в байте modrm. В принципе тут все очевидно и даже не требуется дополнительных комментариев.
§ MOV a, m16
Есть специальные 4 инструкции, которые работают с регистром AL/AX и памятью. Эти инструкции избыточны, поскольку могут быть легко заменены на MOV rm|imm, но, по всей видимости, так захотела INTEL. А SALC эта Intel до сих пор не документировала!case 0xA0: regs[REG_AL] = rd(SEGREG(segment_id, fetch(2)), 1); break; case 0xA1: regs16[REG_AX] = rd(SEGREG(segment_id, fetch(2)), 2); break; case 0xA2: wr(SEGREG(segment_id, fetch(2)), regs[REG_AL], 1); break; case 0xA3: wr(SEGREG(segment_id, fetch(2)), regs16[REG_AX], 2); break;А теперь разберем что тут происходит. Как видим, тут добавлен для удобства новый макрос SEGREG, который позволяет сэкономить на месте и удобочитаемости.
#define SEGREG(a,b) (16*regs16[a] + b)В любом случае будет прочитаны следующие 2 байта, которые будут указывать на адрес в соответствии с выбранным текущим сегментом. По умолчанию он DS, но может быть заменен через префиксы. Остальная логика вполне очевидна. Либо читает, либо пишет AL и AX из памяти или в память.
§ MOV sreg, LEA
Ну и завершая статью, приведу еще 3 инструкции// MOV rm16, seg case 0x8C: put_rm(1, regs16[REG_ES + (i_reg & 3)]); break; // LEA rm16, [address] case 0x8D: regs16[i_reg] = i_ea; break; // MOV seg, rm16 case 0x8E: regs16[REG_ES + (i_reg & 3)] = get_rm(1); break;Первая инструкция извлекает сегмент, который указывается в reg-части байта modrm, и записывается в rm-часть, это либо в память, либо в 16-разрядный регистр.
LEA записывает вычисленный эффективный адрес RM в регистровую часть. Эта инструкция зачастую выступает в качестве быстрого вычислителя.
MOV seg, rm16 записывает в сегмент из RM-операнда.
Ссылка на код.
Следующий материал