加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据处理之数据精简概述

发布时间:2021-05-25 23:53:47 所属栏目:大数据 来源:网络整理
导读:摘自:数据精简DataSimp 转自:数 据观(ID: cbdioreview) 作者:秦陇纪DataSimp 01 数据处理基础知识; data processing 数据是自然和生命的一种表示形式,记录了人类的行为,包括工作、生活和社会发展。数据(Data)是对事实、概念或指令的一种表达形式


数据资产成为和土地、资本、人力并驾齐驱的关键生产要素,而大数据在社会、经济、科学研究等方面正以前所未有的速度,颠覆人们探索世界的方法、驱动产业间的融合与分立。信息社会里数据无处不在,多到个人无法有效存取、处理、获取,时代需要数据精简,希望大家重视每一个领域的数据精简。数据精简用一句话来说就是:数据量越来越大,必须从事后做挖掘分析,变为事先事中做数据精简。

互联网、大数据、物联网、人工智能时代即将普及各种数字设备、智能设备、电子信息设备、车联网、物联网设备,人类以前所未有的速度和规模产生数据、信息和知识。信息世界数据的数量和维度越来越多,我们必须采用数据技术手段获取所需信息,简单的诸如:信息分类目录、分媒体和媒介、分实效性、分受众、做物理存放归类等等,复杂的信息往往也是采用很复杂的数据形式在存储和使用。计算机网络和信息设备的快速发展,产生的海量数据存在于各类服务器、媒介、机构,使用者需要采取不同的办法去寻找、加工数据才可以获得所需信息,比如采用数据挖掘、数据图形化、知识图谱、数据升降维度、数据拟合、数据场景模等。在工业生产中,涉及从数据中提取信息的行业,还在以数据挖掘分析为主要方法。

我们即将进入大数据时代,技术上处于数据挖掘分析阶段,尚未达到数据精简阶段。未来信息数据量进一步爆炸,数量和维度激增,这种事后挖掘分析处理的办法就到了瓶颈。数据技术必须继续前进才可以服务于人。未来的数据存储和处理,必定是信息全生命周期加工使用前和事中,就对数据做出处理,而这种处理是以数据精简为目标导向的。国内数据精简方面的研究和应用还没起步,国外虽然有人在研究也是数量不多。未来是一个数据精简的时代!

大数据时代的信息和数字产品,都有过量花哨的功能与可选项,令人无所适从。数据精简就是把有意义的留下,没用的直接去掉。现实中很多实体企业因精简产品取得举世瞩目的成功、品牌家喻户晓,如谷歌极简的搜索首页、“一键下单”功能的电子购物网站亚马逊、精简外形设计和扁平化体验的苹果iPod、iPhone、iPad、简约设计和外形的宜家家具。消费者愿为更简单直接、节约时间的体验支付更高的价格,使得成本类似的产品产出较高溢价,而非依靠垄断、区域保护、包装和广告等低俗竞争手段取得收益。信息和数据领域即将发生类似情景。

信息时代的生活,各种垃圾信息、庸俗信息、有害信息、虚假信息等遍地横流,严重影响高价值人类社会信息的传递,增加了每个人的信息负担,浪费了不必要的时间和社会成本。各种数字设备、智能设备、电子信息设备、车联网设备、物联网设备普及后,产生的海量信息和数据无时无刻都在存储、传播,形成巨大的成本和时间空间的压力。为了必须做数据精简!

而达成数据精简目标,要为数据精简做铺垫:数据产业数据资源和应用的现状、行业数据应用流程和数据储存分析现状、信息与数据分析、数据领域专家研究领域介绍、数据标准化(结构化数据库、非结构化的网络及非数据文本数据)、全景数据库的精简技术、小数据和大数据关联重合精简等数据科学研究方面。只有做好数据精简的基础,摸清数据现状、夯实精简基础,才有可能做信息和数据的精简。

秦陇纪希望提前进入信息精简领域研究、早日推出数据精简产品服务,降低信息、知识和数据爆炸带来的负面影响。大道至简,至简至丰。希望相关研究者和产业家,共同为数据精简学术和科研做贡献,使国人尽快提高人类信息管理能力。信息精简大有可为,前景诱人!

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读