Aug 14

scrapy 学习笔记(一)

最近学习了一点python,顺便看到了scrapy 这个python 爬虫,似乎比较强大,好用的
用的样子。所以下载下来试用了一下,能进行简单的爬了,但距离目标还有一段距离。
所以这里把学习的过程记录下来,也方便以后回顾。
妄图分成以下几个方面
* 安装

安装下载

未完,待续。。。。。

Aug 14

Ubuntu 12.04 粗略设置

经过一段时间的使用,最终还是回到了ubuntu 上面来。
其实我更喜欢的还是arch,但arch有个问题,就是得经常的去滚它,如果你
跟我一样,有可能一段时间不去滚。那么,当你想滚的时候,会发现,实在太痛苦了
所以,还是回到了ubuntu的怀抱,特别适LTS版本的,几年不用担心出现问题。
前[……]

Read more

Sep 11

Linux文件名编码转换

从Linux往 windows拷贝文件或者从windows往Linux拷贝文件,有时会出现中文文件名乱码的情况,出现这种问题的原因是因为,windows的文件名 中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致,所以导致了文件名乱码的问题,解决这个问题需要对文件名进行[……]

Read more

Sep 11

Unix哲学

Unix哲学起源于Ken Thompson早期关于如何设计一个服务接口简洁、小巧精干的操作系统的思考,随着Unix文化在学习如何尽可能发掘Thompson设计思想的过程中不断成长,同时一路上还从其它许多地方博采众长。

[……]

Read more

Sep 11

如何用正确的方法来写出质量好的软件的75条体会

1. 你们的项目组使用源代码管理工具了么?
应该用。VSS、CVS、PVCS、ClearCase、CCC/Harvest、FireFly都可以。我的选择是VSS。

2. 你们的项目组使用缺陷管理系统了么?
应该用。ClearQuest太复杂,我的推荐是BugZilla。

3. 你们的测试组还在用Word写测试用例么?
不要用Word写测试用例(Test Case)。应该用一个专门的系统,可以是Test Manager,也可以是自己开发一个ASP.NET的小网站。主要目的是Track和Browse。[……]

Read more

Sep 11

端口列表及功能详解

1 tcpmux TCP Port Service Multiplexer   传输控制协议端口服务多路开关选择器
2 compressnet Management Utility     compressnet 管理实用程序
3 compressnet Compression Process     压缩进程
5 rje Remote Job Entry          远程作业登录
7 echo Echo                回显
9 discard Discard             丢弃
11 systat Active Users          在线用户
13 daytime Daytime            时间
17 qotd Quote of the Day         每日引用
18 msp Message Send Protocol       消息发送协议
19 chargen Character Generator      字符发生器
20 ftp-data File Transfer[Default Data]  文件传输协议(默认数据口)[……]

Read more

Sep 01

一句话搞定linux下ssh代理

linux下面用ssh代理非常的方便

只需要在任何一个终端窗口输入:

参数详解:
-D 7070 建立动态Tunnel,监听在本地7070端口。
-q  安静模式。
-T  不分配 TTY ,只做代理用
-f   将 ssh[……]

Read more