Python中escape和unescape

时间:2018-01-28 17:05:35   收藏:0   阅读:2344

Python处理HTML转义字符

在抓网页数据经常遇到例如>或者 这种HTML转义符,抓到字符串里很是烦人。

  比方说一个从网页中抓到的字符串

  p =‘<abc>‘

  用Python可以这样处理:

  

import html
p = <abc>
txt= html.unescape(p)
print (txt)

 

  #这样就得到了txt= ‘<abc>‘

  如果还想转回去,可以这样:
  

import cgi
q = cgi.escape(html)
print(q)

  

       #这样又回到了 html = ‘&lt;abc&gt‘

原文:https://www.cnblogs.com/logo-88/p/8371583.html

评论(0
© 2014 bubuko.com 版权所有 - 联系我们:wmxa8@hotmail.com
打开技术之扣,分享程序人生!