searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

此文件包含不可见的Unicode字符提示的解决方法

2023-09-27 02:12:47
589
0

错误信息:

在写shell脚本时,可能会出现:

“这个文件包含不可见的 Unicode 字符,其处理方式可能不同于下面显示的字符,如果您是有意自正当地使用它们,您可以安全地忽路这个警告。使用 Escape 按知来显示偏的字符。”

 

错误原因分析:

1、定位问题

如果Encoding为UTF-8编码时,不容易发现问题出现在哪些地方,但当Encoding为ANSI编码时查看代码就会很容易定位出有问题的地方,

可以发现,代码中出现:

name=聽centos聽virt聽update

2、分析原因

从变更方案word文档中复制导致的,该复制操作极大可能引起这样的问题出现,问题的根本原因在于,这是因为空格的编码不同导致的,Word文档中使用的字符编码与代码中使用的编码不匹配。例如,Word文档保存为ANSI编码,而代码使用的是UTF-8编码。这会导致从Word复制的文本在代码中显示为乱码。

 

3、测试

同样的,从word中复制命令运行,出现command not found。

 

解决方法:

重新输入代码并更改验证方式。

 

相关知识:

常见的编码方式包括ASCII、UTF-8、UTF-16和UTF-32等。下面是对这些编码方式的解释和分析以及它们的应用场景:

  1. ASCII编码(American Standard Code for Information Interchange):ASCII是最早的字符编码标准,用于表示英语字符和控制字符。它使用7位或8位二进制数表示字符,共计128个字符(包括英文字母、数字和一些特殊字符)。ASCII编码被广泛应用于计算机系统、通信协议和文本文件中,特别适用于英语字符的处理。对于其他非英语字符,ASCII编码无法表示。

  2. UTF-8编码(Unicode Transformation Format):UTF-8是一种可变长度的字符编码方式,基于Unicode字符集。UTF-8编码可以表示包括英语字符和全球范围内的所有字符。它使用1到4个字节表示不同的Unicode字符。对于英文字母和基本的ASCII字符,UTF-8编码和ASCII编码是相同的。UTF-8是互联网上最广泛使用的编码方式,适用于处理多种语言字符和文本文件。

  3. UTF-16编码:UTF-16也是基于Unicode字符集的一种编码方式,使用16位(2个字节)或32位(4个字节)表示各种字符。UTF-16编码主要用于处理较常见的字符,对于少数较为罕见的字符可能会使用较多的存储空间。UTF-16编码在某些操作系统和应用中被广泛应用,特别适用于处理双字节字符(如中文字符)。

  4. UTF-32编码:UTF-32使用32位(4个字节)来表示Unicode字符。它是一种定长编码,对于所有字符都使用相同的字节长度。UTF-32编码适用于需要固定存储空间的应用,但由于每个字符都使用相同的字节数,可能会造成存储空间的浪费。相比之下,UTF-8和UTF-16可以根据字符的不同而动态调整存储空间。

在实际应用中,常用的代码文件(如Java、Python、C++等)通常使用UTF-8编码。UTF-8编码可以处理全球范围内的字符,并且与ASCII编码兼容,因此可以在代码中包含英语字符和其他语言字符。对于文本文件,特别是包含非英语字符的文本文件,也建议使用UTF-8编码。而Word文档通常采用自己的特定编码方式,根据不同的Word版本和设置,可能会使用不同的编码方式,如GBK、GB2312、UTF-8等。

通过选用适当的编码方式,可以确保文本文件和代码能够正确地表示和处理各种字符,避免出现乱码或无法识别的情况。

 

-----------------------从细节做好每一步-----------------

0条评论
0 / 1000
郑****娜
8文章数
0粉丝数
郑****娜
8 文章 | 0 粉丝
原创

此文件包含不可见的Unicode字符提示的解决方法

2023-09-27 02:12:47
589
0

错误信息:

在写shell脚本时,可能会出现:

“这个文件包含不可见的 Unicode 字符,其处理方式可能不同于下面显示的字符,如果您是有意自正当地使用它们,您可以安全地忽路这个警告。使用 Escape 按知来显示偏的字符。”

 

错误原因分析:

1、定位问题

如果Encoding为UTF-8编码时,不容易发现问题出现在哪些地方,但当Encoding为ANSI编码时查看代码就会很容易定位出有问题的地方,

可以发现,代码中出现:

name=聽centos聽virt聽update

2、分析原因

从变更方案word文档中复制导致的,该复制操作极大可能引起这样的问题出现,问题的根本原因在于,这是因为空格的编码不同导致的,Word文档中使用的字符编码与代码中使用的编码不匹配。例如,Word文档保存为ANSI编码,而代码使用的是UTF-8编码。这会导致从Word复制的文本在代码中显示为乱码。

 

3、测试

同样的,从word中复制命令运行,出现command not found。

 

解决方法:

重新输入代码并更改验证方式。

 

相关知识:

常见的编码方式包括ASCII、UTF-8、UTF-16和UTF-32等。下面是对这些编码方式的解释和分析以及它们的应用场景:

  1. ASCII编码(American Standard Code for Information Interchange):ASCII是最早的字符编码标准,用于表示英语字符和控制字符。它使用7位或8位二进制数表示字符,共计128个字符(包括英文字母、数字和一些特殊字符)。ASCII编码被广泛应用于计算机系统、通信协议和文本文件中,特别适用于英语字符的处理。对于其他非英语字符,ASCII编码无法表示。

  2. UTF-8编码(Unicode Transformation Format):UTF-8是一种可变长度的字符编码方式,基于Unicode字符集。UTF-8编码可以表示包括英语字符和全球范围内的所有字符。它使用1到4个字节表示不同的Unicode字符。对于英文字母和基本的ASCII字符,UTF-8编码和ASCII编码是相同的。UTF-8是互联网上最广泛使用的编码方式,适用于处理多种语言字符和文本文件。

  3. UTF-16编码:UTF-16也是基于Unicode字符集的一种编码方式,使用16位(2个字节)或32位(4个字节)表示各种字符。UTF-16编码主要用于处理较常见的字符,对于少数较为罕见的字符可能会使用较多的存储空间。UTF-16编码在某些操作系统和应用中被广泛应用,特别适用于处理双字节字符(如中文字符)。

  4. UTF-32编码:UTF-32使用32位(4个字节)来表示Unicode字符。它是一种定长编码,对于所有字符都使用相同的字节长度。UTF-32编码适用于需要固定存储空间的应用,但由于每个字符都使用相同的字节数,可能会造成存储空间的浪费。相比之下,UTF-8和UTF-16可以根据字符的不同而动态调整存储空间。

在实际应用中,常用的代码文件(如Java、Python、C++等)通常使用UTF-8编码。UTF-8编码可以处理全球范围内的字符,并且与ASCII编码兼容,因此可以在代码中包含英语字符和其他语言字符。对于文本文件,特别是包含非英语字符的文本文件,也建议使用UTF-8编码。而Word文档通常采用自己的特定编码方式,根据不同的Word版本和设置,可能会使用不同的编码方式,如GBK、GB2312、UTF-8等。

通过选用适当的编码方式,可以确保文本文件和代码能够正确地表示和处理各种字符,避免出现乱码或无法识别的情况。

 

-----------------------从细节做好每一步-----------------

文章来自个人专栏
软件开发问题记录
5 文章 | 1 订阅
0条评论
0 / 1000
请输入你的评论
0
0