11.1. 输出格式



  1. >>> t = [[[['black', 'cyan'], 'white', ['green', 'red']], [['magenta',
  2. ... 'yellow'], 'blue']]]
  3. ...
  4. >>> pprint.pprint(t, width=30)
  5. [[[['black', 'cyan'],
  6. 'white',
  7. ['green', 'red']],
  8. [['magenta', 'yellow'],
  9. 'blue']]]


  1. >>> import textwrap
  2. >>> doc = """The wrap() method is just like fill() except that it returns
  3. ... a list of strings instead of one big string with newlines to separate
  4. ... the wrapped lines."""
  5. ...
  6. >>> print(textwrap.fill(doc, width=40))
  7. The wrap() method is just like fill()
  8. except that it returns a list of strings
  9. instead of one big string with newlines
  10. to separate the wrapped lines.


  1. >>> import locale
  2. >>> locale.setlocale(locale.LC_ALL, 'English_United States.1252')
  3. 'English_United States.1252'
  4. >>> conv = locale.localeconv() # get a mapping of conventions
  5. >>> x = 1234567.8
  6. >>> locale.format("%d", x, grouping=True)
  7. '1,234,567'
  8. >>> locale.format_string("%s%.*f", (conv['currency_symbol'],
  9. ... conv['frac_digits'], x), grouping=True)
  10. '$1,234,567.80'

11.2. 模板


这种格式使用的占位符名称由$与有效的 Python 标识符(字母数字字符和下划线)组成。周围的大括号与占位符允许它应遵循的更多字母数字字母并且中间没有空格。$$创建一个转义的$:

  1. >>> from string import Template
  2. >>> t = Template('${village}folk send $$10 to $cause.')
  3. >>> t.substitute(village='Nottingham', cause='the ditch fund')
  4. 'Nottinghamfolk send $10 to the ditch fund.'

当字典或关键字参数中没有提供占位符时,[substitute()]方法将引发[KeyError]。对于邮件-合并风格的应用程序,用户提供的数据可能不完整,这时[safe_substitute()]方法可能会更合适 —— 如果没有数据它将保持占位符不变:

  1. >>> t = Template('Return the $item to $owner.')
  2. >>> d = dict(item='unladen swallow')
  3. >>> t.substitute(d)
  4. Traceback (most recent call last):
  5. ...
  6. KeyError: 'owner'
  7. >>> t.safe_substitute(d)
  8. 'Return the unladen swallow to $owner.'

Template 类的子类可以指定自定义的分隔符。例如,图像浏览器的批量命名工具可能选用百分号作为表示当前日期、图像 序列号或文件格式的占位符:

模板的另一个应用是把多样的输出格式细节从程序逻辑中分类出来。这使它能够替代用户的 XML 文件、 纯文本报告和 HTML 网页报表。

  1. with open('myfile.zip', 'rb') as f:
  2. data = f.read()
  3. for i in range(3): # show the first 3 file headers
  4. start += 14
  5. fields = struct.unpack('<IIIHH', data[start:start+16])
  6. crc32, comp_size, uncomp_size, filenamesize, extra_size = fields
  7. start += 16
  8. filename = data[start:start+filenamesize]
  9. start += filenamesize
  10. extra = data[start:start+extra_size]
  11. print(filename, hex(crc32), comp_size, uncomp_size)
  12. start += extra_size + comp_size # skip to the next header

11.4. 多线程

线程是一种解耦非顺序依赖任务的技术。线程可以用来提高接应用程序受用户输入的响应速度,而其他任务同时在后台运行。一个相关的使用场景是 I/O 操作与另一个线程中的计算并行执行。


  1. import threading, zipfile
  2. class AsyncZip(threading.Thread):
  3. def __init__(self, infile, outfile):
  4. threading.Thread.__init__(self)
  5. self.infile = infile
  6. self.outfile = outfile
  7. def run(self):
  8. f = zipfile.ZipFile(self.outfile, 'w', zipfile.ZIP_DEFLATED)
  9. f.write(self.infile)
  10. f.close()
  11. print('Finished background zip of:', self.infile)
  12. background = AsyncZip('mydata.txt', 'myarchive.zip')
  13. background.start()
  14. print('The main program continues to run in foreground.')
  15. background.join() # Wait for the background task to finish
  16. print('Main program waited until background was done.')

多线程应用程序的最主要挑战是协调线程间共享的数据或其他资源。为此目的,该线程模块提供了许多同步原语包括锁、 事件、 条件变量和信号量。

尽管这些工具很强大,很小的设计错误也可能导致很难复现的问题。因此,任务协调的首选方法是把对一个资源的所有访问集中在一个单独的线程中,然后使用[queue]模块用那个线程服务其他线程的请求。应用程序使用[Queue]对象进行线程间的通信和协调将更容易设计、 更具可读性和更可靠。

11.5. 日志


  1. import logging
  2. logging.debug('Debugging information')
  3. logging.info('Informational message')
  4. logging.warning('Warning:config file %s not found', 'server.conf')
  5. logging.error('Error occurred')
  6. logging.critical('Critical error -- shutting down')


  1. WARNING:root:Warning:config file server.conf not found
  2. ERROR:root:Error occurred
  3. CRITICAL:root:Critical error -- shutting down

默认情况下,信息和调试消息被压制并输出到标准错误。其他输出选项包括将消息通过email、 datagrams、sockets发送,或者发送到 HTTP 服务器。根据消息的优先级,新的过滤器可以选择不同的方式:DEBUG、INFO、WARNING、ERROR和CRITICAL。

日志系统可以直接在 Python 代码中定制,也可以不经过应用程序直接在一个用户可编辑的配置文件中加载。

Python 会自动进行内存管理 (对大多数的对象进行引用计数和[垃圾回收]以循环利用)。在最后一个引用消失后,内存会立即释放。

  1. >>> import weakref, gc
  2. >>> class A:
  3. ... def __init__(self, value):
  4. ... self.value = value
  5. ... def __repr__(self):
  6. >>> a = A(10) # create a reference
  7. >>> d = weakref.WeakValueDictionary()
  8. >>> d['primary'] = a # does not create a reference
  9. >>> d['primary'] # fetch the object if it is still alive
  10. 10
  11. >>> del a # remove the one reference
  12. >>> gc.collect() # run garbage collection right away
  13. 0
  14. >>> d['primary'] # entry was automatically removed
  15. Traceback (most recent call last):
  16. File "<stdin>", line 1, in <module>
  17. d['primary'] # entry was automatically removed
  18. File "C:/python34/lib/weakref.py", line 46, in __getitem__
  19. o = self.data[key]()
  20. KeyError: 'primary'

11.7. 列表工具


The array module provides an array() object that is like a list that stores only homogeneous data and stores it more compactly. The following example shows an array of numbers stored as two byte unsigned binary numbers (typecode "H") rather than the usual 16 bytes per entry for regular lists of Python int objects:


  1. >>> from collections import deque
  2. >>> d = deque(["task1", "task2", "task3"])
  3. >>> d.append("task4")
  4. >>> print("Handling", d.popleft())
  5. Handling task1
  1. unsearched = deque([starting_node])
  2. def breadth_first_search(unsearched):
  3. node = unsearched.popleft()
  4. for m in gen_moves(node):
  5. if is_goal(m):
  6. return m
  7. unsearched.append(m)


  1. >>> import bisect
  2. >>> scores = [(100, 'perl'), (200, 'tcl'), (400, 'lua'), (500, 'python')]
  3. >>> bisect.insort(scores, (300, 'ruby'))
  4. >>> scores
  5. [(100, 'perl'), (200, 'tcl'), (300, 'ruby'), (400, 'lua'), (500, 'python')]


  1. >>> from heapq import heapify, heappop, heappush
  2. >>> data = [1, 3, 5, 7, 9, 2, 4, 6, 8, 0]
  3. >>> heapify(data) # rearrange the list into heap order
  4. >>> heappush(data, -5) # add a new entry
  5. >>> [heappop(data) for i in range(3)] # fetch the three smallest entries
  6. [-5, 0, 1]

11.8. 十进制浮点数运算


  • 财务应用程序和其他用途,需要精确的十进制表示形式,
  • 控制精度,
  • 对符合法律或法规要求,舍入的控制
  • 跟踪有效小数位
  • 用户希望计算结果与手工计算相符的应用程序。
    例如,计算上 70%电话费的 5%税给不同的十进制浮点和二进制浮点结果。区别变得明显如果结果舍入到最接近的分:
  1. >>> from decimal import *
  2. >>> round(Decimal('0.70') * Decimal('1.05'), 2)
  3. Decimal('0.74')
  4. >>> round(.70 * 1.05, 2)
  5. 0.73

[Decimal]的结果总是保有结尾的0,自动从两位精度延伸到4位。Decimal 类似手工完成的数学运算,这就避免了二进制浮点数无法精确表达数据精度产生的问题。



  1. >>> getcontext().prec = 36
  2. Decimal('0.142857142857142857142857142857142857')