Prevalence / DataNews Public

Notifications You must be signed in to change notification settings
Fork 1
Star 0

数据新闻所需要的爬虫和数据分析代码

Prevalence/DataNews

Folders and files

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
Code		Code
Corpus		Corpus
Data2Analyse		Data2Analyse
README.md		README.md
工作簿 1.twb		工作簿 1.twb

Repository files navigation

DataNews

数据新闻所需要的爬虫和数据分析代码

Corpus文件夹里面是爬虫爬来和各种手段整出来的语料原始文件

xxx讲话.txt里面就是xxx的讲话合集汇总了。

Code文件夹里面是用到的代码。

爬虫.py是爬虫文件
分析器.py是用来分析语言的

Data2Analyse文件夹里面是处理后用来进行可视化文件

xxx讲话分词版.txt是文本分词后的结果,强行删除了一些无效的词。
xxx讲话.xls是词频统计后的结果,有调整前比率和调整后比率。调整后比率=调整前比率*10

About

数据新闻所需要的爬虫和数据分析代码

Releases

No releases published

Packages

No packages published

Languages

Python 100.0%

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Prevalence/DataNews

Folders and files

Latest commit

History

Repository files navigation

DataNews

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages

Languages

Prevalence/DataNews

Folders and files

Latest commit

History

Repository files navigation

DataNews

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages