大佬教程收集整理的这篇文章主要介绍了Python 2假定不同的源代码编码,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
-c
和-m
开关,最终(*)运行与所提供的代码exec
语句或compile()
功能,这两者取LaTin-1的源代码:@H_301_0@这没有记录,它是一个实现细节,可能会或可能不会将其视为错误。
@H_301_0@我认为这不值得解决,而LaTin-1是ASCII的超集,因此损失很少。Python 3中已经清理了如何处理代码-c
以及如何-m
处理代码,并且在此更加一致。随同传递的代码将-c
使用当前语言环境进行解码,并且-m
像往常一样,使用该开关加载的模块默认为UTF-8。
@H_301_0@(*)如果您想知道使用的确切实现,请从中的Py_Main()
函数@H_195_2@modules/main.c开始,该函数同时处理-c
和-m
:
if (command) {
sts = PyRun_SimpleStringFlags(command, &cf) != 0;
free(command);
} else if (modulE) {
sts = RunModule(module, 1);
free(modulE);
}
-c
通过PyRun_SimpleStringFlags()
函数执行,该函数依次调用PyRun_StringFlags()
。当使用exec
字节串对象时,也将其传递给它PyRun_StringFlags()
,然后假定源代码包含LaTin-1编码的字节。-m
使用RunModule()
功能的模块名传递给私有函数_run_module_as_main()
中runpy
模块,其使用pkgutil.get_loader()
以加载模块的元数据,并获取与模块代码对象loader.get_code()
上的功能PEP 302装载机; 如果没有可用的缓存字节码,则使用compile()
模式设置为的函数生成代码对象exec
。我注意到,在没有源代码编码声明的情况下,Python 2解释器假定源代码使用 脚本 和 标准输入 以ASCII编码:
$ python test.py # where test.py holds the line: print u'é'
File "test.py",line 1
SyntaxError: Non-ASCII character '\xc3' in file test.py on line 1,but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details
$ echo "print u'é'" | python
File "/dev/fd/63",line 1
SyntaxError: Non-ASCII character '\xc3' in file /dev/fd/63 on line 1,but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details
并使用-m
模块 和-c
命令 标志在ISO-8859-1中进行了编码:
$ python -m test # where test.py holds the line: print u'é'
é
$ python -c "print u'é'"
é
它在哪里记录?
与此相反,Python 3始终假定源代码是用UTF-8编码的,因此可以é
在四种情况下打印。
注意。 –我在控制台编码设置为UTF-8的macOS 10.13和Ubuntu Linux 17.10上的CPython 2.7.14上进行了测试。
以上是大佬教程为你收集整理的Python 2假定不同的源代码编码全部内容,希望文章能够帮你解决Python 2假定不同的源代码编码所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。