超实用:通过Excel进行数据采集

2020年4月27日 评论 153

超实用:通过Excel进行数据采集

前言

IBM大中华区总经理胡世忠曾说:数据构成了智慧地球的三大元素——智能化、互联化和物联化,而这三大元素又改变了数据来源、传送方式和利用方式,带来“大数据”这场信息社会的变革。
从上可见,时代的变革是源于对数据的利用,对企业而言,数据也同样是其发展、转型的命脉。在工作中,我的前辈不止一次地强调,数据是公司的资产,而且举足轻重。我们对待数据,一定要严谨,经得起考验,对自己的数据负责,这是一个数据人的基本要求。

数据资源

大数据时代,数据虽然很多,但是也不是随意得来的,需要利用各种渠道和方式获得。不管从哪个角度来说,数据可分为内部数据和外部数据。内部数据是企业在日积月累的经营中得来的,我们应该对这些数据挖掘、收集有价值的东西,形成企业的数据资产。内部数据重在后期的处理和分析上。
下面先说外部数据的获取方式,以及通过Excel操作来获取外部数据。

超实用:通过Excel进行数据采集

外部数据获取方式

1、专业网站看数据(某一个行业、某一件产品)
2、通过收费渠道买数据(第三方数据平台等)
3、通过特殊形式引数据(网站爬虫,统计网站等)
4、自身积累数据(时间久、跨度长)

Excel获取外部数据

作为一个数据分析师以及想更进一步成长为数据科学家,熟练操作基本的办公软件以及SQL查询是很重要的。请看下面通过Excel获取外部数据的步骤。
第1步:打开“新建web查询”框。新建Excel工作簿,在打开的工作表中单击“数据”选项卡,然后在“获取外部数据”组中单击“自网站”按钮,如下图。

超实用:通过Excel进行数据采集

第2步:输入网址并选择要导入的表格数据。在弹出的“新建web查询”对话框中的“地址”文本框中复制粘贴上述网页的网址,然后单击“转到”,找到网站中的表格数据后单击表格左上角的箭头→,图标变成选中状态的复选框√。如下图。最后单击下方的“导入”按钮。

超实用:通过Excel进行数据采集

第3步:选择数据的放置区域。点击导入后,Excel会出现“导入数据”对话框,如下图,选中你想放置的单元格,单击“确定”开始导入。

超实用:通过Excel进行数据采集

第4步:美化导入的数据。由于导入的数据多且乱,要调整格式使数据规范,并启用冻结窗格功能方便浏览。如下图。

超实用:通过Excel进行数据采集

好了,上面就是通过Excel操作来获取网站上的外部数据,很简单吧,但网站中的数据并非都是以表格的形式呈现,现在大部分是以json格式呈现,Excel不是万能的,而且现在很多网站需要付费才能导数据(上面说过数据就是企业的资产)。

超实用:通过Excel进行数据采集

小结

希望通过上面的操作能帮助大家。如果你有什么好的意见,建议,或者有不同的看法,我都希望你留言和我们进行交流、讨论。
End.
来源:AiryData

国统计网,是国内最早的大数据学习网站,欢迎关注!

超实用:通过Excel进行数据采集

  • 本文由 发表于 2020年4月27日
  • 转载请注意本文链接:http://www.wf-seo.com/seojishu/13469.html
网站优化推广的7种方法 SEO优化

网站优化推广的7种方法

网站推广是网站优化中的重要环节。做网站推广很直接的问题就是没有效果,做了很久没效果。做完新手对于这方面的技术做起来有很难的,而搜索引擎对于图片识别,不仅对排名不利而且也不利于优化,下面小编给大家总结下...
网页抓取工具如何进行http模拟请求 SEO优化

网页抓取工具如何进行http模拟请求

在使用网页抓取工具采集网页时,进行http模拟请求可以通过浏览器自动获取登录cookie、返回头信息,查看源码等。具体如何操作呢?这里分享给大家网页抓取工具火车采集器V9中的http模拟请求。许多请求...
模拟量采集 SEO优化

模拟量采集

以前做高压变频器的时候,用到西门子S7-200的PLC,我们通常情况下一般用到的模拟量是采集后做一些显示的作用,但是在程序中有一段是给PID调节使用的,虽然这部分在现场使用的很少,也是因为在现场使用的...
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: