Python学习记录

Python的创始人为
吉多·范罗苏姆
(Guido van Rossum)

    Python英国发音:/ˈpaɪθən/ 美国发音:/ˈpaɪθɑːn/),是一种面向对象直译式电脑程序语言。它包含了一组功能完备的标准库,能够轻松完成很多常见的任务。它的语法简单,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    与SchemeRubyPerlTcl动态语言一样,Python具备垃圾回收功能,能够自动管理内存使用。它经常被当作脚本语言用于处理系统管理任务和网络程序编写,然而它也非常适合完成各种高级任务。Python虚拟机本身几乎可以在所有的操作系统中运行。使用一些诸如py2exe、PyPy、PyInstaller之类的工具可以将Python源代码转换成可以脱离Python解释器运行的程序。

    Python的官方解释器是CPython,该解释器用C语言编写,是一个由社区驱动的自由软件,目前由Python软件基金会管理。

Python支持命令式程序设计面向对象程序设计函数式编程面向侧面的程序设计泛型编程多种编程范式。

Python中的str与unicode处理方法

2017年09月12日

python2.x中处理中文,是一件头疼的事情。网上写这方面的文章,测次不齐,而且都会有点错误,所以在这里打算自己总结一篇文章。我也会在以后学习中,不断的修改此篇博客。这里假设读者已有与编码相关的基础知识,本文不再再次介绍,包括什么是utf-8,什么是unicode,它们之间有什么关系。str与字节码首先,我们完全不谈unicode。1s = "人生苦短"s是个字符串,它本身存储的就是字节码。那么...

TinyOS生成docs时报UnicodeDecodeError: 'ascii' codec can't decode byte错误的解决方法

2017年09月12日

python在安装时,默认的编码是ascii,当程序中出现非ascii编码时,python的处理常常会报这样的错UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128)有2种方法设置python的默认编码:方法一:在程序中加入以下代码:import sys re...

抓取新浪博客内容

2017年09月12日

抓取新浪文章列表内容:import urllibimport lxml.htmlimport csvimport codecsimport sysreload(sys)sys.setdefaultencoding('utf8')con=urllib.urlopen('http://blog.sina.com.cn/s/articlelist_5971014532_0_1.html').read()...

lxml.etree._ElementUnicodeResult 转为字符

2017年09月12日

在爬虫过程中,使用的是lxml的xpath查找对应的字段。 address=each.xpath('.//address/text()')[0].strip() 结果用address与一般的字符进行拼接时,总是出现UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(...

[Errno 13] Permission denied

2017年09月11日

最近在写python的时候,报如下错误:[Errno 13] Permission denied在网上查了一下,是因为:没有权限根据这个提示,查看了一下CSV文件,一看这个CSV文件打开了,直接关闭这个文件问题解决。参考网址:python报IOError: [Errno 13]Permission denied非伸手党无奈了?黄兵个人博客原创。转载请注明出处:黄兵个人博客 - [Errno 13]...

Python 如何获得href值

2017年09月11日

最近在使用python写爬虫,抓取新浪博客文章,通过每页抓取链接,之后怎么也取不到href值,最后用lxml.html抽取了href值,代码如下:import urllibimport lxml.htmlcon=urllib.urlopen('http://blog.sina.com.cn/s/articlelist_5971014532_0_1.html').read()tree=lxml.ht...

beautiful soup选择器之CSS选择器

2017年09月04日

BeautifulSoup支持大部分的CSS选择器,其语法为:向tag或soup对象的.select()方法中传入字符串参数,选择的结果以列表形式返回。   tag.select("string")   BeautifulSoup.select("string") 源代码示例: html = """<html> <head> ...

Python 爬虫遇到形如 &#x5c0f;&#x8bf4; 的编码如何转换为中文?

2017年09月04日

html> <dt>学科主题:</dt> <dd><a href="openlink.php?keyword=%E9%95%BF%E7%AF%87%E5%B0%8F%E8%AF%B4">&#x957f;&#x7bc7;&#x5c0f;&#x8bf4;</a>-&#x4e2d;&#x56fd;-&#x5f53;&#x4ee3;</dd> ...