大数据年代,用数据做出理性剖析明显更为有力。做数据剖析前,能够找到适宜的数据源是一件十分重要的事,获取数据的方法有很多种,不用限制。本文中给咱们引荐一些能够用得上的数据获取方法~
UCI :经典的机器学习、数据发掘数据集,包括分类、聚类、回归等问题下的多个数据集。很经典也比较陈旧,但仍然活泼在科研学者的视野中。
国家数据 :数据来历中华人民共和国国家计算局,包括了我国经济民生等多个方面的数据,并且在月度、季度、年度都有掩盖,全面又威望。
CEIC :最完好的一套超越128个国家的经济数据,能够准确查找GDP、CPI、进口、出口、外资直接投资、零售、出售以及国际利率等深度数据。其间的“我国经济数据库”收编了300,000多条时刻序列数据,数据内容包括宏观经济数据、职业经济数据和地区经济数据。
万得 :扼要介绍:被誉为我国的Bloomberg,在金融业有着全面的数据掩盖,金融数据的类目更新十分快,听说很受国内的商业剖析者和投资人的喜爱。
搜数网 :已加载到搜数网站的计算资料到达7874本,包括1,761,009张计算表格和364,580,479个计算数据,汇集了我国资讯行自92年以来搜集的一切计算和查询数据,并供给多样化的查找功用。
我国计算信息网 :国家计算局的官方网站,汇集了海量的全国各级政府各年度的国民经济和社会开展计算信息,建立了以计算公报为主,计算年鉴、阶段开展数据、计算剖析、经济新闻、首要计算目标排行等。
亚马逊 :来自亚马逊的跨科学云数据途径,包括化学、生物、经济等多个范畴的数据集。
figshare :研讨成果同享途径,在这儿能够找到来自国际的大牛们的研讨成果共享,获取其间的研讨数据。
github :一个十分全面的数据获取途径,包括各个细分范畴的数据库资源,自然科学和社会科学的掩盖都很全面,适合做研讨和数据剖析的人员。
上海市政务数据服务网 :掩盖经济建设、文明科技、信誉服务、交通出行等12个要点范畴数据。
Data.gov :美国政府敞开数据,包括气候、教育、动力金融等各范畴数据。
这儿给出了一些网站途径,咱们能够运用爬虫爬取网站上的数据,某些网站上也给出获取数据的API接口,但需求付费。
(1)新浪财经:免费供给接口,这篇博客教授了如安在新浪财经上获取获取前史和实时股票数据。