整理一波非常全的数据资源汇总网站(建议收藏)

Last updated on 15 1 月, 2023 at 12:18 下午

整理一波非常全的数据资源汇总网站(建议收藏)
整理一波非常全的数据资源汇总网站(建议收藏)

Grammarly
检测是否抄袭,拼写/语法/标点/用词正误
一款比endnote还好用的免费文献管理工具:zotero!
文献管理与云存储的完美结合体:浏览器插件,支持多用户端和tag分类,自动抓取pdf/网页,写论文时可直接引用插入! https://www.zotero.org/
以查询同义词反义词的网站Synonyms.net
http://www.synonyms.net/还有除了English外,还有 日本語、 Deutsch甚至包括 العربية Arabic

万千合集站http://www.hejizhan.com/学术书籍下载网站,中英文书籍皆有,似乎人文学科内容较少,一般是百度网盘链接

语义学者(Semantic Scholar)
https://www.semanticscholar.org/由微软联合创始人 Paul Allen 做的免费学术搜索引擎,其检索结果来自于期刊、学术会议资料或者是学术机构的文献。目前能检索到 80% 的免费论文文献,大约有 300 万份,可能部分检索结果在部分地区无法打开原链接,有需自取。

两个英语学习的大杀器!第一是Reference Machinehttp://wtva1.elc.polyu.edu.hk/CILL/referencemachine.htm香港科大英语学习神作,能够帮助你提高语法和词汇,还有写作技巧可以参考,但最重要的就是可以生成Reference!不需要记格式,只要输入信息就可以生成正确格式的Reference,Harvard,APA应有尽有! 第二就是易改http://www.1checker.com/提供可以信赖的英文语法和词汇的纠错,同时提供尚属不错的润色,免费软件中能做到这样的水准已经是令人惊讶了,论文水准霎时间提升一档的必杀技!

免费论文(OA)下载网站一览
一、搜索引擎
Open AccessLibrary
www.oalib.com
即开放存取图书馆,致力于为学术研究者提供全面、及时、优质的免费阅读科技论文。已经存有 994,092 篇免注册,免费使用下载的英文期刊论文。

OATD
http://oatd.org/
目前索引了来自1000家学术机构的超过240万笔论文。

PQDT Open
http://pqdtopen.proquest.com/

OAIster
http://www.oclc.org/home.en.html
密歇根大学开发维护的一个优秀的开放存取搜索引擎,收集了来自536 家学术机构的590万篇文档。

DART-EuropeE-theses Portal
http://www.dart-europe.eu/basic-search.php
欧洲学位论文库,现有资源547363笔,来自欧洲28个国家的563所大学,开放获取,检索浏览均可

OA图书馆
http://www.souoa.com/
搜索5000多个Open Access(开放存取)资源,绝大部分文献可免费下载全文。

DOAJ
http://doaj.org/
DOAJ由瑞典Lund大学图书馆创建和维护,专门OA期刊文献检索系统,但不包括预印本资源。该系统收录期刊的文章都是经过同行评议或严格评审的,质量高,与期刊发行同步,且都能免费下载全文,是做研究的好帮手。

GoOA
http://gooa.las.ac.cn/external/index.jsp
开放获取论文一站式发现平台,服务对象主要为中国科学院研究人员,重点加强对高质量开放获取期刊的遴选,制定了规范的开放获取期刊评价原则和方法,实现开放获取期刊和论文的集成、语义检索和统计,并提供针对作者投稿的开放获取期刊推荐(主要是外文文献)。

中国科学院文献情报中心
http://www.las.ac.cn/
中科院的学术搜索工具,非OA,不过标注了【获取全文】的,都能跳转到原网站下载。

RePEc
http://repec.org/
经济学论文搜索,其EconPapers(http://econpapers.repec.org/)页面有591,440 篇论文 (523,590 可下载) 、 2,123 册期刊中的1,050,528文章 (984,639 可下载)、 和19,642 书籍 (9,214 可下载),还有一些其他资源或者文章,自行探索吧。

台湾eThesys
http://fedetd.mis.nsysu.edu.tw/FED-db/cgi-bin/FED-search/search_s

Ethos
http://ethos.bl.uk/Home.do

万方数据 开放存取网
http://www.paperopen.com/
资源数量:目前共收录OA期刊2345家,其中中文期刊102 家,外文期刊2243 家;论文总数为 521262篇(已经相当时间没有更新了)。

Socolar
http://www.socolar.com/
中国教育图书进出口公司认为一方面有必要对世界上重要的OA期刊和OA仓贮资源进行全面的收集和整理,另一方面也有必要支持对重要OA期刊和OA仓贮资源进行统一检索,所以启动了Socolar项目,旨在为用户提供OA资源的一站式检索服务(注册登录后会省去一些验证的麻烦,但是很多链接已经失效了)。

二、OA论文储存库
中国科技论文在线
http://www.paper.edu.cn/
教育部科技发展中心主办,主要涉及数学、 物理、天文物理与空间科学 、化学 、 地球科学、农业与生物学、生命科学、健康与医学 、 工程、能源与技术、环境科学 、力学、材料科学、计算机科学和经济学与商务管理等等,可下载全文PDF。

PapersWeLove
http://paperswelove.org/
一个有关于计算机学术科学的论文资源库,所有的论文都是有世界各地的优秀学者提交上来了的,该站也是一个论文讨论社区,根据不同的城市来分类,旨在帮助用户找到合适的论文并参与到本地的讨论中去,可以在GitHub网站上找到源码,也可以把自己的论文提交上去。

Questia
https://www.questia.com/
在线研究和论文写作资源,包含书籍、期刊、杂志和报纸文章。内容涉及如历史, 哲学、经济学、政治科学、英语和文学、人类学、 心理学和社会学。 资源总数相当巨大,来自信誉良好的商业和学术出版社的超过78000册在线书籍,900万多份杂志和报纸文章。

arXiv
http://arxiv.org/
一个收集物理学、数学、计算机科学与生物学论文预印本的网站。至2015年3月为止,arXiv.org已收集了超过1,025,646 篇预印本,并以约略每月五千篇的速率增加。

ScienceDirect
http://www.sciencedirect.com/
ScienceDirect是世界上科学研究出版的最大在线收藏。出版商是荷兰的爱思唯尔公司,包含了大约一千一百万篇文章、2500种期刊、6000多册电子图书、参考书、手册。

PMC
http://www.ncbi.nlm.nih.gov/pmc/

PLOS
http://www.plos.org/publications/journals/

国家哲学社会科学学术期刊数据库
http://www.nssd.org/
需要注册,阅读下载皆免费,深夜下载论文似乎有问题。

三、开放期刊
SCIRP
http://www.scirp.org/
开放获取期刊学术出版商。该出版社还出版学术著作和会议记录。SCIRP目前在科学,技术和医学领域有200多种开放获取期刊。书籍、论文、期刊、会议记录开放存取,免费下载。

TandfOnline
http://www.tandfonline.com/
一家理论和科学图书出版商,每年出版540多种期刊和1500多种新书,也是世界最大电子图书出版集团,电子图书出版的数量超过18000册,涵盖和各学科,为不同领域的研究人员 学者提供了丰富的资料。非OA,但有大量openaccess和freeaccess文献可供大众查询下载。

汉斯国际中文开源期刊网
http://www.hanspub.org/
聚焦于OpenAccess中文期刊出版发行, 覆盖以下领域: 数学物理、生命科学、化学材料、地球环境、医药卫生、工程技术、信息通讯、人文社科、经济管理等。目前,汉斯出版社的部分期刊已被世界著名开源期刊数据库DOAJ和知网(CNKI Scholar)等数据库收录。

Ivy出版社
http://www.ivypub.org/Index.shtml
专注于国际中文期刊的出版发行,所有论文均可以在世界范围内免费浏览、下载全文。又一个中文开源期刊网站,值得推荐,相关行业的朋友可以去看看。

这部分实在太多,各位可以移步:
国家科技图书文献中心【开放获取期刊集成检索试用系统】
http://oairs.nstl.gov.cn:8080/NSTL_OAJ/
有相当清晰的分类,可检索不同类型的期刊,同样也推荐
国家科技图书文献中心:http://www.nstl.gov.cn/
个人认为是非常好的文献搜索工具(需要注册),全文搜索、引文搜索功能非常强大,不过勾选过多选项后加载速度较慢,但大部分文章下载需付费。

四、其他(这部分并非官方开放下载)
全国图书馆参考咨询联盟
http://www.ucdrs.superlib.net/
注册登录后,搜索关键词,就能查找相应的论文、报纸等资源,选择邮箱接受全文,即可免费获得电子版资源(caj格式),不过要注意的是,尽量选择在平常工作时间请求全文,深夜请求的话,只能等到白天才有回复了(似乎是人工服务,耐心等待吧)。

学术猫
http://www.scimao.com/
中外论文免费在线阅读(无图),提供由百度支持的全文搜索,一直没有开放注册,想投稿论文可以先加入他们的QQ群。

爱学术
http://www.ixueshu.com/
论文、期刊下载网站,下载方式为关注公众号获取提取码,另有查重功能。注意广告比较恶心。

中国科技期刊开放获取平台(China Open Access Journals, COAJ)
http://www.oaj.cas.cn/

Referats
http://referats.net.ua/
乌克兰语及俄语论文、期刊文章下载网站,各个学科都有涉及,俄乌双语界面,输入验证码即可下载,一般为doc 。

Hrčak
http://hrcak.srce.hr/?lang=en
克罗地亚科学期刊的核心门户,英语为主,所有内容开放下载。

Science Alert
http://scialert.net/index.php
国际科学出版社,目前有150种期刊,主要涉及农学  生物学、商学、 化学、计算机科学、地球科学、经济学、工程学、环境科学、材料科学、数学、医学、物理和社会科学。进入期刊介绍页面,点击【Current Issue】或 【Previous Issues】就能看到文章下载链接。

OpenScience Directory
http://www.opensciencedirectory.net/
开放期刊搜索引擎, 该站收录大约13000种科技期刊(英语为主),基本都可下载全文(因需要转到源地址,下载速度不一)。

ThaiScience
http://www.thaiscience.info/
泰国科技开放论文站点,绝大部分可下载(因为是索引的其他泰国站点,有些站点文件已经删除),大部分为英语,关注一下欧美及日本以外的科技论文也是有好处的。

中国科学院科技论文预发布平台
http://chinaxiv.org/home.htm

Preprints
http://www.preprints.org/

openENGR

Home

SocArXiv
https://osf.io/preprints/socarxiv/

PsyArXiv
https://osf.io/preprints/psyarxiv/

J-STAGE
https://www.jstage.jst.go.jp/browse
日本最大的综合性电子杂志平台,收录了日本各科技学会出版的文献(以英文为主),包括255种电子期刊,多种会议录以及研究报告等。其中199种期刊、大部分会议录及研究报告可免费浏览全文。

中国・アジア研究論文データベース
http://www.spc.jst.go.jp/cad/homes
中国和其他亚洲国家研究论文数据库,部分内容可下载或在线阅读。

BookSC
http://zh.booksc.org/
BookZZ的分支站点,50,000,000+科学期刊文章,有中文界面,但目前只有英语文章,下载速度快。注意检索时不要输入范围过大的词汇,否则无法显示出全部检索结果。

国家哲学社会科学文献中心
http://www.ncpssd.org/index.aspx
不能代替知网, 他的中文期刊只有1000多种,知网超过10000种,更何况他无法下载学位论文,当然他可以阅读超过7000种外文期刊非常难得。如果是在线看中文期刊,可用国图账号关联龙源期刊等网站,下载中文期刊和学位论文,仍推荐【全国参考咨询联盟】.

Etdohiolink
https://etd.ohiolink.edu/
俄亥俄州立大学电子学论文,索引更新及时,涵盖机械、电子、管理、哲学、环境学、化学、物理、数学、材料等学科。

NDLTD学位论文数据库
http://www.ndltd.org/resources
搜索地址:http://search.ndltd.org/index.php
NDLTD(NetworkedDigital Library of Theses and Dissertations,简称NDLTD),是由美国国家自然科学基金支持的一个网上学位论文共建共享项目,为用户提供免费的学位论文文摘,还有部分可获取的免费学位论文全文(根据作者的要求,NDLTD文摘数据库链接到的部分全文分为无限制下载,有限制下载,不能下载几种方式),以便加速研究生研究成果的利用。目前全球有200多家图书馆、7个图书馆联盟、20多个专业研究所加入了NDLTD,其中20多所成员已提供学位论文文摘数据库7万条,可以链接到的论文全文大约有3万篇。为方便我国用户访问,我国CALIS文献中心引进了部分NDLTD资源。

ThesesCanada
http://www.collectionscanada.gc.ca/thesescanada/
该网站提供了一个加拿大学位论文信息查询的集中入口。在此网站上可免费检索AMICUS的学位论文及相关信息。AMICUS为全加拿大公共书目信息检索系统,其学位论文库建立于1965年,收录加拿大1300多个图书馆的学位论文信息。另外还可免费检索和获得加拿大1998年至2002年出版的部分论文信息

公开的数据库

-国家数据 -

http://data.stats.gov.cn/index.htm

数据来源于中国国家统计局,包含了我国经济民生等多个方面的数据,并且在月度、季度、年度都有覆盖,较为全面和权威,对于社会科学的研究不要太有帮助。最关键的是,网站简洁美观,还有专门的可视化读物。

-CEIC -

http://www.ceicdata.com/zh-hans

最完整的一套超过128个国家的经济数据,能够精确查找GDP, CPI, 进口,出口,外资直接投资,零售,销售,以及国际利率等深度数据。其中的“中国经济数据库”收编了300,000多条时间序列数据,数据内容涵盖宏观经济数据、行业经济数据和地区经济数据。

-wind(万得)-

http://www.wind.com.cn/

万得被誉为中国的Bloomberg,在金融业有着全面的数据覆盖,金融数据的类目更新非常快,据说很受国内的商业分析者和投资人的亲睐。

- 搜数网 -

http://www.soshoo.com/

已加载到搜数网站的统计资料达到7,874本,涵盖1,761,009张统计表格和364,580,479个统计数据,汇集了中国资讯行自92年以来收集的所有统计和调查数据,并提供多样化的搜索功能。

- 中国统计信息网 -

http://www.tjcn.org/

国家统计局的官方网站,汇集了海量的全国各级政府各年度的国民经济和社会发展统计信息,建立了以统计公报为主,统计年鉴、阶段发展数据、统计分析、经济新闻、主要统计指标排行等。

- 亚马逊aws-

http://aws.amazon.com/cn/datasets/?nc1=h_ls

来自亚马逊的跨科学云数据平台,包含化学、生物、经济等多个领域的数据集。

-figshare -

https://figshare.com/

研究成果共享平台,在这里你会发现来自世界的大牛们的研究成果分享,同时get其中的研究数据,内容很有启发性,网站颇具设计感。

-github -

https://github.com/caesar0301/awesome-public-datasets

如果觉得前面的数据源还不够,github上的大神已经为大家整理好了一个非常全面的数据获取渠道,包含各个细分领域的数据库资源,自然科学和社会科学的覆盖都很全面,简直是做研究和数据分析的利器。

随便上几个图,满满的都是资源啊~

数据交易平台

- 优易数据 -

http://www.youedata.com/

由国家信息中心发起,拥有国家级信息资源的数据平台,国内领先的数据交易平台。平台有B2B、B2C两种交易模式,包含政务、社会、社交、教育、消费、交通、能源、金融、健康等多个领域的数据资源。

- 数据堂 -

http://www.datatang.com/

专注于互联网综合数据交易,提供数据交易、处理和数据API服务,包含语音识别、医疗健康、交通地理、电子商务、社交网络、图像识别等方面的数据。

网络指数

- 百度指数 -

http://index.baidu.com/

大家都很熟悉的指数查询平台,可以根据指数的变化查看某个主题在各个时间段受关注的情况,进行趋势分析、舆情预测有很好的指导作用。除了关注趋势之外,还有需求分析、人群画像等精准分析的工具,对于市场调研来说具有很好的参考意义。同样的另外两个搜索引擎搜狗、360也有类似的产品,都可以作为参考。

- 阿里指数 -

https://alizs.taobao.com/

国内权威的商品交易分析工具,可以按地域、按行业查看商品搜索和交易数据,基于淘宝、天猫和1688平台的交易数据基本能够看出国内商品交易的概况,对于趋势分析、行业观察意义不小。

- 艾瑞咨询 -

http://www.iresearch.com.cn/

艾瑞作为老牌的互联网研究机构,在数据的沉淀和数据分析上都有得天独厚的优势,在互联网的趋势和行业发展数据分析上面比较权威,艾瑞的互联网分析报告可以说是互联网研究的必读刊物。

- 友盟指数 -

http://www.umeng.com/

友盟在移动互联网应用数据统计和分析具有较为全面的统计和分析,对于研究移动端产品、做市场调研、用户行为分析很有帮助。除了友盟指数,友盟的互联网报告同样是了解互联网趋势的优秀读物。

- 爱奇艺指数 -

http://index.iqiyi.com/

爱奇艺指数是专门针对视频的播放行为、趋势的分析平台,对于互联网视频的播放有着全面的统计和分析,涉及到播放趋势、播放设备、用户画像、地域分布、等多个方面。由于爱奇艺庞大的用户基数,该指数基本可以说明实际情况。

- 猫眼专业版-

http://piaofang.maoyan.com/

电影票房统计分析平台,猫眼专业版有实时的票房统计,影片的排盘情况、上座率和影院数据,对于当前电影的分析是必不可少的。

网络采集器

网络采集器是通过软件的形式实现简单快捷地采集网络上分散的内容,具有很好的内容收集作用,而且不需要技术成本,被很多用户作为初级的采集工具。

- 火车采集器 -

http://www.locoy.com/

一款专业的互联网数据抓取、处理、分析,挖掘软件,可以灵活迅速地抓取网页上散乱分布的数据信息,并通过一系列的分析处理,准确挖掘出所需数据,最常用的就是采集某些网站的文字、图片、数据等在线资源。接口比较齐全,支持的扩展比较好用,懂代码的话,可以使用PHP或C#开发任意功能的扩展。

- 八爪鱼 -

http://www.bazhuayu.com/

简单实用的采集器,功能齐全,操作简单,不用写规则。特有的云采集,关机也可以在云服务器上运行采集任务。

-集搜客 -

http://www.gooseeker.com/

一款简单易用的网页信息抓取软件,能够抓取网页文字、图表、超链接等多种网页元素,提供好用的网页抓取软件、数据挖掘攻略、行业资讯和前沿科技等。

网络爬虫

作为极客们最喜欢的数据收集方式,爬虫高度的自由性、自主性都使其成为数据挖掘的必备技能,当然精通python等语言是必要前提。

利用爬虫可以做很多有意思的事情,当然也可以获取一些从其它渠道获取不到的数据资源,更重要的是帮你打开寻找和搜集数据的思路。

-利用爬虫爬取网络图片 -

爬取的图像素材

你看到某个网站上的图片恰好是你需要的,但是量大单个下载太麻烦,那么利用爬虫你可以快速地进行抓取,并可以根据标签、特征、颜色等信息进行分类储存。从此不缺设计素材,不缺美女图片,连斗图都多了几分自信。

-利用爬虫爬取高质量资源 -

爬取的音乐资源

我们总是想快速地去搜集高质量的网络资源,但是人工查找比对实在太麻烦,利用爬虫你就可以轻松解决。比如爬取知乎点zan最多的文章列表,爬取网易云音乐评论最多的音乐,爬取豆瓣网高评分的电影或图书……总之,你可以从此拒绝平庸。

-利用爬虫获取舆情数据 -

爬取的某招聘网站职位信息

比如你可以批量爬取社交平台的数据资源,可以爬取网站的交易数据,爬取招聘网站的职位信息等,可以用于个性化的分析研究。

总之,爬虫是非常强大的,甚至有人说天下没有不能爬的网站,因而爬取数据也成为了很多极客的乐趣。开发出高效的爬虫工具可以帮助我们节省很多时间,可以完全按照自己的需求来订制,想想这个世界就太美好。

小工具

- Web Plot Digitizer -

http://arohatgi.info/WebPlotDigitizer/app/

比如我们在查看期刊文献的时候看到一张成型的图表,但其本身数据是缺失的,你想获得这个图表的相关数据怎么办?有了这个小工具就非常easy了。直接上传我们需要获得数据的图表,如下:

然后我们就会获得如下的数据反馈,感觉运筹帷幄有木有,对于一些不需要十分精确的分析研究足够使用。

当然并不推荐用这个作为量化分析的依赖,对于定性的分析,做ppt级的数据统计分析就足够了。

- you-get -

https://you-get.org/

这是一个程序员基于python 3开发的项目,已经在github上面开源,支持64个网站,包括优酷、土豆、爱奇艺、b站、酷狗音乐、虾米……总之你能想到的网站都有! 还有一个黑科技的地方,即使是名单上没有的网站,当你输入链接,程序也会猜测你想要下载什么,然后帮你下载。

下载优酷视频

批量下载图片

当然you-get要在python3环境下进行安装,用pip安装好后,在终端输入“you get+你想下载资源的链接”就可以等着收藏资源了。

数据导航

收集数据是一种能力,学习收集数据也是一种能力,数据的来源是没有穷尽的,转换一种思维,你就可以获得不一样的数据,下面推荐几个可以用到的大数据导航,从这里面你可能会发现一些你自己想要的东西。每个人喜欢的收集数据的渠道不尽相同,只有尽量多地去见识和实践才会发现更多的适合自己的数据获取方式。

- 199IT大数据导航 -

http://hao.199it.com/

-数据分析网导航 -

http://www.afenxi.com/hao

-大数据人导航 -

http://hao.bigdata.ren/

Leave a Reply

您的邮箱地址不会被公开。 必填项已用 * 标注