-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathmul.asm
457 lines (377 loc) · 16.3 KB
/
mul.asm
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
section .text
global _start
_start:
sub rsp, 6 * 128 * 8 ; украли место у стека
lea rbp, [rsp]
push rdi
push rcx
lea rdi, [rbp]
mov rcx, 768 ; 6 * 128 * 8 = 768 * 8 = 768 qwords
call set_zero
pop rcx
pop rdi
lea rdi, [rsp + 128 * 8] ; mov rdi, rsp + 128 * 8 ; конец второго числа
mov rcx, 128
call read_long ; записываем в рсп и идем в правo, но рсп не двигается
; mov rdi, rsp ; место начала второго лонга ; второй лонг лежит слева от первого
; call read_long
; lea rsi, [rsp + 128 * 8
; lea rdi, [rsp + 2 * 128 * 8]
; call copy_long_long
; lea rsi, [rsp + 128 * 8]
; call add_long_long
mov rcx, 256
call mul_long_long
push rdi
push rcx
lea rdi, [rbp + 4 * 128 * 8]
mov rcx, 256
call write_long
pop rcx
pop rdi
mov al, 0x0a
call write_char
jmp exit
mul_long_long:
push rsi
push rsp
push rbp
push rdi
push rcx
.loop:
push rdi
push rcx
lea rdi, [rbp + 2 * 128 * 8]
mov rcx, 2 * 128 ; 6 * 128 * 8 = 768 * 8 = 768 qwords
call set_zero
pop rcx
pop rdi
push rsi
push rdi
push rcx
lea rsi, [rbp + 128 * 8]
lea rdi, [rbp + 2 * 128 * 8]
mov rcx, 128 ; 6 * 128 * 8 = 768 * 8 = 768 qwords
call copy_long_long
pop rcx
pop rdi
pop rsi
push rsi
push rbp
push rdi
push rcx
push rbx
call read_char
mov rbx, rax
sub rbx, 48
cmp rax, 0x0a
je .skip_loop
lea rdi, [rbp + 2 * 128 * 8]
mov rcx, 256
call mul_long_short
pop rbx
pop rcx
pop rdi
pop rbp
pop rsi
push rsi
push rbp
push rdi
push rcx
mov rbx, 10
lea rdi, [rbp + 4 * 128 * 8]
mov rcx, 2 * 128
call mul_long_short
pop rcx
pop rdi
pop rbp
pop rsi
push rsi
push rdi
push rcx
lea rsi, [rbp + 2 * 128 * 8]
lea rdi, [rbp + 4 * 128 * 8]
mov rcx, 2 * 128 ; 6 * 128 * 8 = 768 * 8 = 768 qwords
call add_long_long
pop rcx
pop rdi
pop rsi
jmp .loop
.skip_loop:
pop rbx
pop rcx
pop rdi
pop rbp
pop rsi
pop rcx
pop rdi
pop rbp
pop rsp
pop rsi
ret
; copies long number from rsi to rdi
copy_long_long:
push rdi
push rsi
push rcx
clc
.loop:
mov rax, [rsi]
lea rsi, [rsi + 8]
mov [rdi], rax
lea rdi, [rdi + 8]
dec rcx
jnz .loop
pop rcx
pop rsi
pop rdi
ret
; adds two long number
; rdi -- address of summand #1 (long number) ; старшие биты (левые)
; rsi -- address of summand #2 (long number)
; rcx -- length of long numbers in qwords
; result:
; sum is written to rdi
add_long_long:
push rdi
push rsi
push rcx
clc
.loop:
mov rax, [rsi]
lea rsi, [rsi + 8]
adc [rdi], rax
lea rdi, [rdi + 8]
dec rcx
jnz .loop
pop rcx
pop rsi
pop rdi
ret
; adds 64-bit number to long number
; rdi -- address of summand #1 (long number)
; rax -- summand #2 (64-bit unsigned)
; rcx -- length of long number in qwords
; result:
; sum is written to rdi
add_long_short:
push rdi
push rcx
push rdx
xor rdx, rdx
.loop:
add [rdi], rax ; добавили к конечному ответу часть второго сумматора
adc rdx, 0 ; rdx += кэрри флаг
mov rax, rdx ; переносим флаг в ракс и он так на следующей итерации прибавится
xor rdx, rdx
add rdi, 8
dec rcx
jnz .loop
pop rdx
pop rcx
pop rdi
ret
; multiplies long number by a short
; rdi -- address of multiplier #1 (long number)
; rbx -- multiplier #2 (64-bit unsigned)
; rcx -- length of long number in qwords
; result:
; product is written to rdi
mul_long_short:
push rax
push rdi
push rcx
push rbp
push rsi
xor rsi, rsi
.loop:
mov rax, [rdi] ; мы взяли первые четыре байта числа
mul rbx ; если у нас раикс переполнился то мы старшие биты записываются в рсай
add rax, rsi ; прибавляем рсай с предыдущего шага
adc rdx, 0 ; адд с флагом переноса
mov [rdi], rax
add rdi, 8
mov rsi, rdx
dec rcx
jnz .loop
pop rsi
pop rbp
pop rcx
pop rdi
pop rax
ret
; divides long number by a short
; rdi -- address of dividend (long number)
; rbx -- divisor (64-bit unsigned)
; rcx -- length of long number in qwords
; result:
; quotient is written to rdi
; rdx -- remainder
div_long_short:
push rdi
push rax
push rcx
lea rdi, [rdi + 8 * rcx - 8] ;
xor rdx, rdx
.loop:
mov rax, [rdi]
div rbx ; мы тут делим на самом делим число rdxrax. т.е. остаток от деление используется на следующей итерации
mov [rdi], rax
sub rdi, 8
dec rcx
jnz .loop
pop rcx
pop rax
pop rdi
ret
; assigns a zero to long number
; rdi -- argument (long number)
; rcx -- length of long number in qwords
set_zero:
push rax
push rdi ; присваивает заачению по адресу raxб поэтому он двигаетсяаа
push rcx ; становится нулем т.к. счетчик
xor rax, rax
rep stosq ; заполняет rcx раз в поле rdi rax со сдвигом в один ворд
pop rcx
pop rdi
pop rax
ret
; checks if a long number is a zero
; rdi -- argument (long number)
; rcx -- length of long number in qwords
; result:
; ZF=1 if zero
is_zero:
push rax
push rdi ; указатель на младший разряд выводимого числа
push rcx
xor rax, rax
rep scasq ; сравнить rcx раз поле rdi с rax со сдвигом в один ворд
pop rcx
pop rdi
pop rax
ret
; read long number from stdin
; rdi -- location for output (long number)
; rcx -- length of long number in qwords
read_long:
push rcx
push rdi
call set_zero
.loop:
call read_char
; xor rax, rax ; не нужно
js exit
cmp rax, 0x0a
je .done
cmp rax, '0'
jb .invalid_char
cmp rax, '9'
ja .invalid_char
sub rax, '0'
mov rbx, 10
call mul_long_short
call add_long_short
jmp .loop
.done:
pop rdi
pop rcx
ret
.invalid_char:
mov rsi, invalid_char_msg
mov rdx, invalid_char_msg_size
call print_string
call write_char
mov al, 0x0a
call write_char
.skip_loop:
call read_char
;or rax, rax
js exit
cmp rax, 0x0a
je exit
jmp .skip_loop
; write long number to stdout
; rdi -- argument (long number)
; rcx -- length of long number in qwords
write_long:
push rax
push rcx
mov rax, 20
mul rcx ; rax = 128 * 20
mov rbp, rsp
sub rsp, rax ; украли у рсп 20 * 128 байт памяти
mov rsi, rbp
.loop:
mov rbx, 10
call div_long_short ; левое число делится на 10. Удаляется старший символ и все число сдвигается влево [(rbp)(rdi)(rsi)302800000] => [(rbp)(rdi)(rsi)028000000]
add rdx, '0'; в rdx лежит младшая цифра числа и мы делаем из нее чар
dec rsi
mov [rsi], dl ; в рсай поцифренно записываем число
call is_zero ; заполнен ли весь рдай нулями
jnz .loop
mov rdx, rbp
sub rdx, rsi ; эти дви строки rdx = rbp - rsi ; длина нашего выводимого числа
call print_string
mov rsp, rbp ; возвращаем на место рсп, т.к. сдвинули его в самом начале функции
pop rcx
pop rax
ret
; read one char from stdin
; result:
; rax == -1 if error occurs
; rax \in [0; 255] if OK
read_char:
push rcx
push rdi
sub rsp, 1
xor rax, rax ; тип сискол считывание
xor rdi, rdi ; считываем из стдин
mov rsi, rsp ; сказали считать в рсп
mov rdx, 1 ; сколько считать
syscall ; поместили в рсай куда считать. поместили мы адрес рсп
cmp rax, 1 ; возвращает количество аргументов считанных
jne .error
xor rax, rax
mov al, [rsp] ; самая маленькая самая маленькая часть регистра Rax, 1 байт
add rsp, 1 ; двигаем указатель памяти на 1 байт
pop rdi
pop rcx
ret
.error:
mov rax, -1
add rsp, 1 ; двигаем указатель на место куда считать чтобы в сл раз не просрать что считали
pop rdi
pop rcx
ret
; write one char to stdout, errors are ignored
; al -- char
write_char:
sub rsp, 1 ; вычли там чет даня про стек даня говорил
mov [rsp], al
mov rax, 1
mov rdi, 1
mov rsi, rsp
mov rdx, 1 ; сколько выводить
syscall
add rsp, 1
ret
exit:
mov rax, 60
xor rdi, rdi
syscall
; print string to stdout
; rsi -- string
; rdx -- size
print_string:
push rax
mov rax, 1
mov rdi, 1
syscall
pop rax
ret
section .rodata
invalid_char_msg:
db "Invalid character: "
invalid_char_msg_size: equ $ - invalid_char_msg