Assembly 如何删除字符串中的所有标点和空格?

Assembly 如何删除字符串中的所有标点和空格?,assembly,x86,masm,irvine32,Assembly,X86,Masm,Irvine32,我的意见如下: 这是,,*&%a:;演示+字符串+需要**@!//格式:::::!!!这个` 所需输出: 这就是我们需要形成的 我必须在不使用Stru trim的情况下执行此操作。 编辑:我正在写一个加密程序。我必须删除字符串中的所有标点符号,并在加密之前将所有小写字母转换为大写字母 我添加了代码。我需要删除空格或任何标点符号,然后再将其转换为大写。到目前为止,我还没有在我的书中找到任何可以帮助这一点,除了stru-trim,我们是不允许使用的 INCLUDE Irvine32.inc .da

我的意见如下:

这是,,*&%a:;演示+字符串+需要**@!//格式:::::!!!这个`

所需输出:

这就是我们需要形成的

我必须在不使用Stru trim的情况下执行此操作。


编辑:我正在写一个加密程序。我必须删除字符串中的所有标点符号,并在加密之前将所有小写字母转换为大写字母

我添加了代码。我需要删除空格或任何标点符号,然后再将其转换为大写。到目前为止,我还没有在我的书中找到任何可以帮助这一点,除了stru-trim,我们是不允许使用的

INCLUDE Irvine32.inc

.data
source  byte  "This is the source string",0

.code
main proc


mov  esi,0              ; index register
mov  ecx,SIZEOF source  ; loop counter
L1:
mov  al,source[esi]     ; get a character from source
and  source[esi], 11011111b     ; convert lower case to upper case
inc  esi                ; move to next character
loop L1                 ; repeat for entire string

mov edx, OFFSET source
call WriteString

exit
main endp
end main

您已经在尝试从小写改为大写,因此,我将帮助您删除标点符号。接下来的代码使用我的建议:将大写字母移动到辅助字符串,忽略标点符号。我使用了EMU8086编译器:

.stack 100h
.data
source  db  "STRING, WITH. PUNCTUATION : AND * SPACES!$"
aux     db  "                                          "
.code
  mov  ax, @data
  mov  ds, ax

;REMOVE EVERYTHING BUT UPPERCASE LETTERS.

  mov  si, offset source   ; POINT TO STRING.
  mov  di, offset aux      ; POINT TO AUXILIARY.
L1:
  mov  al, [ si ]          ; get character from source
;CHECK IF END STRING ($).
  cmp  al, '$'
  je   finale
;CHECK IF CHAR IS UPPERCASE LETTER.
  cmp  al, 65
  jb   is_not_a_letter    ; CHAR IS LOWER THAN 'A'.
  cmp  al, 90
  ja   is_not_a_letter    ; CHAR IS HIGHER THAN 'Z'.
;COPY LETTER TO AUX STRING.
  mov  [ di ], al
  inc  di                ; POSITION FOR NEXT CHARACTER.
is_not_a_letter:
  inc  si                ; move to next character
  jmp  L1

finale:
  mov  [ di ], al        ; '$', NECESSARY TO PRINT.

;PRINT STRING.  
  mov  dx, OFFSET aux
  mov  ah, 9
  int  21h

;END PROGRAM.
  mov  ax, 4c00h
  int  21h              
我用“$”结束字符串,因为我用
int 21h
打印字符串


如您所见,我没有使用CX或循环指令。我要做的是重复,直到找到“$”为止。您也可以这样做,直到找到0。

这是我删除所有标点并将其转换为大写后的代码

INCLUDE Irvine32.inc

.data
source  byte  "STriNG, @# WITH.[][][ lalalala PUncTuATION : AND * SpaceS!", 0
target  byte  SIZEOF source DUP(0), 0                                           

.code
main PROC

    pushad

    mov edx, offset source
    call WriteString
    call CrlF
    mov edx, 0

    mov  esi, offset source 
    mov  edi, offset target      
L1:
    mov  al, [ esi ]          ; get character from source

    cmp  al, 0
    je   final

    cmp  al, 65
    jb   not_letter    ; if char is lower than 'A' jump to not letter
    cmp al, 122
    ja  not_letter     ; if char is greater than 'z' jump to not letter

    cmp al, 90
    ja Label1           ; jump if above 'Z'
    jmp next            ; false
    Label1:
    cmp al, 97
    jl Label2           ; jmp if less than 'a'
    jmp next            ; false
    Label2:             ; if both are true than is greater than 'Z' but less than 'a'
    jmp not_letter      ; jump to not letter

    next:
    mov  [ edi ], al
    inc  di                ; position to next character.

    not_letter:
    inc  si                ; move to next character
    jmp  L1

    final:
    mov  [ edi ], al     

    mov  edx, OFFSET target
    mov  ah, 9
    call WriteString
    call CrlF

    mov  esi,0              ; index register
    mov  ecx,SIZEOF source  ; loop counter
    L2:
    mov  al, target[esi]     ; get a character from source
    and  target[esi], 11011111b     ; convert lower case to upper case
    inc  esi                ; move to next character
    loop L2                 ; repeat for entire string

    mov edx, OFFSET target
    call WriteString
    call CrlF

    popad

  exit
  main endp
  end main

亲爱的@masuchiura,发布您的代码,以便我们可以帮助您修复或改进它。我正在编写一个加密程序。我必须删除字符串中的所有标点符号,并在加密之前将所有小写字母转换为大写。@JoseManuelAbarcaRodríguez我现在已经添加了代码。我必须先删除所有空格/标点,然后才能将其转换为大写字母(我知道怎么做)。将字母从源字符串移动到辅助字符串,忽略标点字符。我的回答解释了如何忽略这些字符:如果字符小于65或大于90,则它不是大写字母。您可以在适当的位置执行此操作,从DI=SI开始。在第一个非字母出现之前,您正在重写刚刚加载的字符。之后,在数组中读取的时间要晚于写入的时间。