Python执行系统命令的方法
(1) os.system
# 仅仅在一个子终端运行系统命令,而不能获取命令执行后的返回信息
system(command) -> exit_status
Execute the command (a string) in a subshell.
# 如果再命令行下执行,结果直接打印出来
1 | >>> os.system('ls') |
# 仅仅在一个子终端运行系统命令,而不能获取命令执行后的返回信息
system(command) -> exit_status
Execute the command (a string) in a subshell.
# 如果再命令行下执行,结果直接打印出来
1 | >>> os.system('ls') |
这些天除了忙交大的复试,还一直忙于用 Python 编写抓图程序。好在前几天收到了短信,心总算放了下来,毕竟这一年在思过崖的面壁得到了回报。然而,在西安找实习工作时却处处碰壁,我想说考官大姐们你们可不能以貌取人啊,凭什么他比我帅你们就招他了……算了,不说了,男儿有泪不轻弹,只是未到桑心处。
程序的功能基本已经实现,可是原先仅仅考虑到抓一个网站的图片,当换一个网站,却又得重新编写 HTML 解析代码,好不麻烦。所以,便想着利用设计模式重构代码,使其可应用与大多数图片网站,甚至应用于视频网站。_因为程序仍处于开发期,所以在此我并不能透漏具体要抓取的页面地址,实在抱歉。_下面我们来看看该程序具体如何实现:
关于 BeautifulSoup3 对 gb2312
编码的网页解析的乱码问题,【这篇文章】提出了一个勉强能用的解决方法。即如果中文页面编码是 gb2312
,gbk
,在 BeautifulSoup 构造器中传入 fromEncoding="gb18030"
参数即可解决乱码问题,即使分析的页面是 utf8
的页面使用 gb18030
也不会出现乱码问题!如:
正方系统的一个漏洞是获取学生图片时没有对学生身份进行检测。理论上来说,获取学生李四的照片,需要首先判断登陆者身份是教师或者学生,如果是学生还要判断登陆者是否为李四本人,而正方系统在这一方面并没有做得很好,导致张三可以轻松地获取李四的照片。
下面是笔者编写的一个简单的爬虫程序,Python 代码如下(Python 3.2),
使用 Wireshark 抓包后得到校正方系统的登陆过程如下:
Update your browser to view this website correctly.&npsb;Update my browser now