Python语言技术文档

微信小程序技术文档

php语言技术文档

jsp语言技术文档

asp语言技术文档

C#/.NET语言技术文档

html5/css技术文档

javascript

点击排行

您现在的位置:首页 > 技术文档 > Python网络爬虫

python实现网页链接提取的方法分享

来源:中文源码网    浏览:153 次    日期:2024-05-03 14:19:51
【下载文档:  python实现网页链接提取的方法分享.txt 】


python实现网页链接提取的方法分享
复制代码 代码如下:#encoding:utf-8import socketimport htmllib,formatterdef open_socket(host,servname): s=socket.socket(socket.AF_INET,socket.SOCK_STREAM) port=socket.getservbyname(servname) s.connect((host,port)) return shost=''host=input('请输入网址\n')mysocket=open_socket(host,'http')message='GET http://%s/\n\n'%(host,)mysocket.send(message)file=mysocket.makefile()htmldata=file.read()file.close()parser=htmllib.HTMLParser(formatter.NullFormatter()) parser.feed(htmldata)print '\n'.join(parser.anchorlist)parser.close()

相关内容