11|文本的细节:关于字符、编码、行你所需要知道的一切
该思维导图由 AI 生成,仅供参考
什么是文本
- 深入了解
- 翻译
- 解释
- 总结
本文深入浅出地介绍了Vim编辑器中关于文本的重要概念,包括字符、编码和行。文章首先强调了文本文件与二进制文件的区别,然后详细介绍了字符和编码的概念,特别强调了UTF-8作为Unicode里最重要的编码方式。此外,还涉及了文件编码的自动检测和转换,以及字符和字形的概念。对行结束符的不同风格和Vim编辑器中的断行功能也进行了详细介绍。另外,文章还介绍了Vim编辑器在需要时可以用来查看和编辑二进制文件的功能。总的来说,本文为读者提供了全面的知识储备,有助于更好地理解和应用Vim编辑器。
《Vim 实用技巧必知必会》,新⼈⾸单¥59
全部留言(7)
- 最新
- 精选
- 瀚海星尘CR,LF,\r,\n一直没搞明白,这次算懂了,原来是打字机发展出来的。
作者回复: 对。好多名词,脱开历史起源,就不好理解了。比如 upper-case 和 lower-case,原因是以前的活字排版系统里,大写字母放上面的盒子里,小写字母放下面的盒子里而已。 增加点无用的知识,也算是一种乐趣吧。 :-)
2020-09-076 - 人在江湖龙在江湖字符集和字符编码不是一个概念,字符集定义了文字和二进制的对应关系,为字符分配了唯一的编号,而字符编码规定了如何将文字的编号存储到计算机中. ascii,big5,GBK 等既有字符集功能,又有字符编码功能。unicode是字符集,utf8是字符编码。而我们看到的gbk-utf8这个我觉得是用了gbk的字符集功能,当存储的时候不用gbk自己的字符编码功能,而用utf8的字符编码功能
作者回复: “字符集和字符编码不是一个概念”:对。所以我讲到GB2312时特意强调了“编码GB2312”并不是个准确的说法。 “我们看到的gbk-utf8这个”:对不起,我真没见到过这种用法。如果你知道哪儿有这样的用法,还需要你来详细说明一下。 如果限定字符集只能是GBK范围内,那使用UTF-8好处非常有限,至少多了编码结果变长这个坏处。
2021-01-212 - 鸿哥一直不明白setloca和set的区别,老师能说一下么
作者回复: setlocal 设置的是当前缓冲区的选项。你可以全局 tabstop 是8,但当前缓冲区的 tabstop 是 4。只要这个想象支持本地设置即可。这讲的基本都支持。
2020-08-181 - 我来也学习了,长知识了。😄
作者回复: 😇 似乎你总是最早完成学习的人啊!
2020-08-1721 - dog_brotherUTF-8,最多可以到6个字节吧?
作者回复: 并没有。最大编码点是 U+10FFFF,而不是 U+7FFFFFFF。
2022-05-20 - pyhhouau FileType changelog setlocal textwidth=76 这里是 changelog 类型的 file,vim 才能修改 textwidth? 另外,思考题最后一问,感觉像是 vim 内部存有一个文件后缀名映射到具体编码的 mapping,然后打开文件会根据文件的后缀名和映射关系来确定所使用的文本编码方式?
作者回复: 是changelog类型,上面的脚本才会去设置为文本宽度为76,这个类型的一个标准宽度吧。 “另外”部分,请复习第 8 讲。
2020-08-20 - 奕由于 GB2312 中本身也含有 ASCII 中包含的字符,在使用中逐渐就形成了“半角”和“全角”的区别 ------------ 这个有什么前后的因果关系吗?2022-07-24