利用python从大文本文件中获取含有特定字符的行

实现的内容如标题,其实也有一些软件能够实现上述效果,若是利用mac或者是linux直接用vim也可以,这里针对以上都不符合,又不想费太大劲去找其他方法的方法

很简单,先从python官网下载一个python软件,直接安装就可以,这里一般选择最新的就可以了

然后照着下面的代码根据自己要求进行改造,不懂的欢迎交流:

with open('access.log', 'r', buffering=163840, encoding='utf8') as srcFile:
	with open('result.txt','w',encoding='utf8') as resultFile:
		srcText = srcFile.readline();
		while srcText:
			if('za.biz.etcp.cn' in srcText):
				resultFile.write(srcText);
			srcText = srcFile.readline();

除了摘取,有些时候打不开切成几个小文件也可以,代码如下:

# -*- coding:utf-8 -*-
indata = open("access.log",'r')
global index;
index = 0;
fileIndex = 0;
def outPutFile(fileIndex):
	global index;
	with open(str(fileIndex)+".txt", 'w', buffering=163840, encoding='utf8') as out:
	    line = indata.readline();
	    index = index + 1;
	    while line:
	    	index = index + 1;
	    	line = indata.readline();
	    	out.write(line);
	    	if(index % 100000 == 0):
	    		fileIndex = fileIndex + 1;
	    		outPutFile(fileIndex)
	    		break;
	    	index = index + 1;
	    	line = indata.readline();
outPutFile(fileIndex)

感谢看完指鹤文章,希望指鹤的文章对您有所帮助。

闲暇时,指鹤喜欢写一些文章,部分发表在了豆瓣网与17K中文网,若是您对此感兴趣,您可以点击下面连接支持下指鹤,指鹤在此表示感谢了

绝命笔记 一封匿名信引发的追寻 迷案追凶 量子危机 玄冥石 神魔序曲 杂集地址

Leave a Reply

Your email address will not be published.