bytes.__repr__表示是如何工作的?
问题描述
bytes
是0<;=x<;256范围内的不变整数序列。
bytes.__repr__
如何工作?
为什么有时使用x
转义,而有时不使用转义?例如bytes([118, 255])
显示为b'vxff'
,只有一个x
。我知道x
用于传达超出ASCII范围的值?这里还有什么事吗?
我想深入了解一下这是如何工作的?甚至可以向我推荐这些功能的CPython源代码。
谢谢
解决方案
感兴趣的代码似乎是this:
if (c == quote || c == '\')
*p++ = '\', *p++ = c;
else if (c == ' ')
*p++ = '\', *p++ = 't';
else if (c == '
')
*p++ = '\', *p++ = 'n';
else if (c == '')
*p++ = '\', *p++ = 'r';
else if (c < ' ' || c >= 0x7f) {
*p++ = '\';
*p++ = 'x';
*p++ = Py_hexdigits[(c & 0xf0) >> 4];
*p++ = Py_hexdigits[c & 0xf];
}
else
*p++ = c;
如果c < ' ' || c >= 0x7f
,则使用带x
的转义序列。(0x7f
为127,btw)。ASCII表中' '
之前的所有内容都是特殊字符。请参见http://www.asciitable.com/。第一列中的所有内容都将由repr
转义。请注意,反斜杠、引号、换行符、回车符和制表符被视为特例。
相关文章