“2017年9月”存档文章有139

抓取新浪博客内容

抓取新浪文章列表内容:import urllibimport lxml.htmlimport csvimport codecsimport sysreload(sys)sys.setdefaultencoding('utf8')con=urllib.urlopen('http://blog.sina.com.cn/s/articlelist_5971014532_0_1.html').read()...

lxml.etree._ElementUnicodeResult 转为字符

在爬虫过程中,使用的是lxml的xpath查找对应的字段。 address=each.xpath('.//address/text()')[0].strip() 结果用address与一般的字符进行拼接时,总是出现UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(...

[Errno 13] Permission denied

最近在写python的时候,报如下错误:[Errno 13] Permission denied在网上查了一下,是因为:没有权限根据这个提示,查看了一下CSV文件,一看这个CSV文件打开了,直接关闭这个文件问题解决。参考网址:python报IOError: [Errno 13]Permission denied非伸手党无奈了?黄兵个人博客原创。转载请注明出处:黄兵个人博客 - [Errno 13]...

Python 如何获得href值

最近在使用python写爬虫,抓取新浪博客文章,通过每页抓取链接,之后怎么也取不到href值,最后用lxml.html抽取了href值,代码如下:import urllibimport lxml.htmlcon=urllib.urlopen('http://blog.sina.com.cn/s/articlelist_5971014532_0_1.html').read()tree=lxml.ht...

附加类型“BlogAppDAL.Entities.Archives”的实体失败,因为相同类型的其他实体已具有相同的主键值。

最近在写代码的时候遇到如下错误:附加类型“BlogAppDAL.Entities.Archives”的实体失败,因为相同类型的其他实体已具有相同的主键值。在使用 "Attach" 方法或者将实体的状态设置为 "Unchanged" 或 "Modified" 时如果图形中的任何实体具有冲突键值,则可能会发生上述行为。这可能是因为某些实体是新的并且尚未接收数据库生成的键值。在此情况下,使用 "Add"...

input[file]标签的accept=”image/*”属性在google浏览器上响应很慢的解决办法

input[file]标签的accept属性可用于指定上传文件的MIME类型。例如,想要实现默认上传图片文件的代码,代码可如下:<input type="file" name="file" class="element" accept="image/*"解决办法如下:<input type="file" accept="image/gif,image/jpeg,image/jpg,image/pn...

怎么把 json 格式转换成 数组格式?

先看一段json数据:"[{\"ArchivesName\":\"2016年11月\",\"ArchivesCount\":63},{\"ArchivesName\":\"2016年12月\",\"ArchivesCount\":99},{\"ArchivesName\":\"2017年1月\",\"ArchivesCount\":71},{\"ArchivesName\":\"2017年2月\"...

C#把datetime类型的日期转化成年月日或其他格式方法总结

日期格式:yyyyMMdd HH:mm:ss(注意此字符串的字母大小写很严格)yyyy:代表年份MM: 代表月份dd: 代表天HH: 代表小时(24小时制)mm: 代表分钟ss: 代表秒DateTime.Now.ToShortTimeString()DateTime dt = DateTime.Now;dt.ToString();//2005-11-5 13:21:25dt.ToFile...