Python执行系统命令的方法

(1) os.system

# 仅仅在一个子终端运行系统命令,而不能获取命令执行后的返回信息

system(command) -> exit_status
Execute the command (a string) in a subshell.

# 如果再命令行下执行,结果直接打印出来

1
2
3
4
>>> os.system('ls')
04101419778.CHM bash document media py-django video
11.wmv books downloads Pictures python
all-20061022 Desktop Examples project tools
Read more

利用 Python 实现抓图程序

这些天除了忙交大的复试,还一直忙于用 Python 编写抓图程序。好在前几天收到了短信,心总算放了下来,毕竟这一年在思过崖的面壁得到了回报。然而,在西安找实习工作时却处处碰壁,我想说考官大姐们你们可不能以貌取人啊,凭什么他比我帅你们就招他了……算了,不说了,男儿有泪不轻弹,只是未到桑心处。

程序的功能基本已经实现,可是原先仅仅考虑到抓一个网站的图片,当换一个网站,却又得重新编写 HTML 解析代码,好不麻烦。所以,便想着利用设计模式重构代码,使其可应用与大多数图片网站,甚至应用于视频网站。_因为程序仍处于开发期,所以在此我并不能透漏具体要抓取的页面地址,实在抱歉。_下面我们来看看该程序具体如何实现:

Read more

BeautifulSoup3 编码问题总结

关于 BeautifulSoup3 对 gb2312 编码的网页解析的乱码问题,【这篇文章】提出了一个勉强能用的解决方法。即如果中文页面编码是 gb2312gbk,在 BeautifulSoup 构造器中传入 fromEncoding="gb18030" 参数即可解决乱码问题,即使分析的页面是 utf8 的页面使用 gb18030 也不会出现乱码问题!如:

Read more

【正方教务管理系统】HACK日志(二)

正方系统的一个漏洞是获取学生图片时没有对学生身份进行检测。理论上来说,获取学生李四的照片,需要首先判断登陆者身份是教师或者学生,如果是学生还要判断登陆者是否为李四本人,而正方系统在这一方面并没有做得很好,导致张三可以轻松地获取李四的照片。

下面是笔者编写的一个简单的爬虫程序,Python 代码如下(Python 3.2),

Read more
Your browser is out-of-date!

Update your browser to view this website correctly.&npsb;Update my browser now

×