Python学习记录

Python的创始人为
吉多·范罗苏姆
(Guido van Rossum)
Python(英国发音:/ˈpaɪθən/ 美国发音:/ˈpaɪθɑːn/),是一种面向对象、直译式的电脑程序语言。它包含了一组功能完备的标准库,能够轻松完成很多常见的任务。它的语法简单,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。
与Scheme、Ruby、Perl、Tcl等动态语言一样,Python具备垃圾回收功能,能够自动管理内存使用。它经常被当作脚本语言用于处理系统管理任务和网络程序编写,然而它也非常适合完成各种高级任务。Python虚拟机本身几乎可以在所有的操作系统中运行。使用一些诸如py2exe、PyPy、PyInstaller之类的工具可以将Python源代码转换成可以脱离Python解释器运行的程序。
Python的官方解释器是CPython,该解释器用C语言编写,是一个由社区驱动的自由软件,目前由Python软件基金会管理。
Python支持命令式程序设计、面向对象程序设计、函数式编程、面向侧面的程序设计、泛型编程多种编程范式。
Python中的str与unicode处理方法
2017年09月12日
python2.x中处理中文,是一件头疼的事情。网上写这方面的文章,测次不齐,而且都会有点错误,所以在这里打算自己总结一篇文章。我也会在以后学习中,不断的修改此篇博客。这里假设读者已有与编码相关的基础知识,本文不再再次介绍,包括什么是utf-8,什么是unicode,它们之间有什么关系。str与字节码首先,我们完全不谈unicode。1s = "人生苦短"s是个字符串,它本身存储的就是字节码。那么...
TinyOS生成docs时报UnicodeDecodeError: 'ascii' codec can't decode byte错误的解决方法
2017年09月12日
python在安装时,默认的编码是ascii,当程序中出现非ascii编码时,python的处理常常会报这样的错UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128)有2种方法设置python的默认编码:方法一:在程序中加入以下代码:import sys re...
抓取新浪博客内容
2017年09月12日
抓取新浪文章列表内容:import urllibimport lxml.htmlimport csvimport codecsimport sysreload(sys)sys.setdefaultencoding('utf8')con=urllib.urlopen('http://blog.sina.com.cn/s/articlelist_5971014532_0_1.html').read()...
lxml.etree._ElementUnicodeResult 转为字符
2017年09月12日
在爬虫过程中,使用的是lxml的xpath查找对应的字段。 address=each.xpath('.//address/text()')[0].strip() 结果用address与一般的字符进行拼接时,总是出现UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(...
[Errno 13] Permission denied
2017年09月11日
最近在写python的时候,报如下错误:[Errno 13] Permission denied在网上查了一下,是因为:没有权限根据这个提示,查看了一下CSV文件,一看这个CSV文件打开了,直接关闭这个文件问题解决。参考网址:python报IOError: [Errno 13]Permission denied非伸手党无奈了?黄兵个人博客原创。转载请注明出处:黄兵个人博客 - [Errno 13]...
Python 如何获得href值
2017年09月11日
最近在使用python写爬虫,抓取新浪博客文章,通过每页抓取链接,之后怎么也取不到href值,最后用lxml.html抽取了href值,代码如下:import urllibimport lxml.htmlcon=urllib.urlopen('http://blog.sina.com.cn/s/articlelist_5971014532_0_1.html').read()tree=lxml.ht...
beautiful soup选择器之CSS选择器
2017年09月04日
BeautifulSoup支持大部分的CSS选择器,其语法为:向tag或soup对象的.select()方法中传入字符串参数,选择的结果以列表形式返回。 tag.select("string") BeautifulSoup.select("string") 源代码示例: html = """<html> <head> ...
Python 爬虫遇到形如 小说 的编码如何转换为中文?
2017年09月04日
html> <dt>学科主题:</dt> <dd><a href="openlink.php?keyword=%E9%95%BF%E7%AF%87%E5%B0%8F%E8%AF%B4">长篇小说</a>-中国-当代</dd> ...