首页 技术 正文
技术 2022年11月17日
0 收藏 531 点赞 2,385 浏览 942 个字

0.课程地址与说明


1.课程地址:https://www.coursera.org/learn/python-network-data/home/welcome 2.课程全名:Using Python to Access Web Data3.建议使用Python2进行学习4.仅第一周有中文字幕,其它的只有英文字幕,只要英语有四级基本没有太大问题5.本人使用的工具是蓝灯,做作业时可以用Google翻译插件帮帮忙注:第一周讲课程说明和安装Python,无笔记

1.Regular Expressions – Part 1


1.Regular Expression Quick Guide

Python Web-第二周-正则表达式(Using Python to Access Web Data)

()用于截取匹配的字符串,举列

 <p>Please click <a href="http://www.dr-chuck.com" rel="external nofollow" >here</a></p>
href="(.+)" rel="external nofollow" 匹配 http://www.dr-chuck.com
href=".+" rel="external nofollow" 匹配 href="http://www.dr-chuck.com/page2.htm" rel="external nofollow"

2.翻译

dot .   asterisk *

3.举列

Python Web-第二周-正则表达式(Using Python to Access Web Data)

^X.*:

以X开始,后面接任意数量的字母(”.”表示字母,”*”表示任意数量)且以”:”结尾

^X-\S+:

以X-开始,接着是一个字符数大于0且没有空格的字符串,字符串的最后以”:”结尾

4.re.findall() 返回所有匹配项

Python Web-第二周-正则表达式(Using Python to Access Web Data)

[0-9]+

任意0-9之间的数字,可以是多个数字。因为时findall()所以会返回所有的数字

5.Greedy Matching 贪心匹配

Python Web-第二周-正则表达式(Using Python to Access Web Data)

*和+都是向外搜索去匹配最大的可匹配项,当然也可以使用 *?、+?来实现非贪心匹配

2.Regular Expressions – Part 2


1.通过括号来微调匹配结果

Python Web-第二周-正则表达式(Using Python to Access Web Data)

普通的email提取

Python Web-第二周-正则表达式(Using Python to Access Web Data)

以”From “开头的Email提取

2.[^ ]用于排除字符

 address=re.findall('@([^ ]*)',data)
print(address)

可以实现从@开始找,直到找到一个空格就停

3.[]内的”.”

Python Web-第二周-正则表达式(Using Python to Access Web Data)

方括号内的”.”并不代表任意字符,而仅仅代表”.”

4.Escape Character, 字符前加”\”保留原意

Python Web-第二周-正则表达式(Using Python to Access Web Data)

来自为知笔记(Wiz)

附件列表

http://yunpan.cn/cubw8yLXSVudF 访问密码 f7bf

相关推荐
python开发_常用的python模块及安装方法
adodb:我们领导推荐的数据库连接组件bsddb3:BerkeleyDB的连接组件Cheetah-1.0:我比较喜欢这个版本的cheeta…
日期:2022-11-24 点赞:878 阅读:9,489
Educational Codeforces Round 11 C. Hard Process 二分
C. Hard Process题目连接:http://www.codeforces.com/contest/660/problem/CDes…
日期:2022-11-24 点赞:807 阅读:5,904
下载Ubuntn 17.04 内核源代码
zengkefu@server1:/usr/src$ uname -aLinux server1 4.10.0-19-generic #21…
日期:2022-11-24 点赞:569 阅读:6,737
可用Active Desktop Calendar V7.86 注册码序列号
可用Active Desktop Calendar V7.86 注册码序列号Name: www.greendown.cn Code: &nb…
日期:2022-11-24 点赞:733 阅读:6,490
Android调用系统相机、自定义相机、处理大图片
Android调用系统相机和自定义相机实例本博文主要是介绍了android上使用相机进行拍照并显示的两种方式,并且由于涉及到要把拍到的照片显…
日期:2022-11-24 点赞:512 阅读:8,128
Struts的使用
一、Struts2的获取  Struts的官方网站为:http://struts.apache.org/  下载完Struts2的jar包,…
日期:2022-11-24 点赞:671 阅读:5,290