如何在gedit上扫描无效字符?

Modified on: Fri, 13 Jul 2018 17:06:00 +0800

我是否有编辑javascript文件的困境。当我用gedit打开它时,它会显示以下警告:

  

您打开的文件包含一些无效字符。如果你继续
  编辑此文件可能会损坏此文档。你也可以选择
  另一个字符编码,然后再试一次。

当前编码为UTF-8。由于该文件有超过100,000行代码,是否有快速扫描无效字符的方法?

最佳答案

由于文件为UTF-8,您可以运行isutf8。一个额外的utils包。
它为您提供了不良字节的行,字符和偏移量。

然后使用xxd,hexdump等进行分析。

不幸的是它在第一次崩溃时停止了。但那又取决于文件。可以
只有一个坏字节;)

有一些C代码可以对整个文件进行类似的分析。它开着
一个早已忘记的磁盘。如果有需要,可以尝试找到它。

否则是的,快速而不是 脏的方式是在它们之间做差异
用gedit保存的副本 - 正如先生所建议的那样。 @vonbrand

作者:Community,Runium

相关问答

添加新评论