大数据字面的意思是指大量数据,这种大量数据一般指千万条以上的数据。
此外,互联网上的大数据除了量大之外,还具有如下特征数据产生速度和处理速度极高;数据类型多样,包含文本、图片、视频等类型,比如医院同时有病历(结构化)和CT影像(非结构化);海量数据中仅少量有用,像从10万条评论里找用户投诉;数据是真实的,不是人为自动产生的。
互联网大数据用途非常广泛,比如个人的行为分析,人工智能的训练数据、风险分析、各领域的智能化等等。
在大企业中,比如银行电信等行业,其也存在大数据,其对企业的经营和管理发挥着巨大作用。
有大数据,自然有小数据:
小数据是指数据量较小的数据集合。起初的计算机的数据量都比较小,自从互联网产生之后,数据量发生了质的变化,成了海量数据、大数据。
小数据一般都产生于企业事业单位的生产经营管理的信息系统,有的产生于手工收集,一般数据量都在百万级和千万级左右。小数据和大数据相比有其明显的区别。
1、 精准性
数据来自信息系统、数据具有精准性,每个信息都有明确的定义,无效数据很少。比如客户信息中的姓名、性别等
2、 关联性
数据之间关联性非常强,数据相互依赖、相互联系。比如,交易数据中,交易编号、交易时间、交易金额等都紧密相关。
3、 深度价值
每个数据都有其业务含义,无论在生产业务,还是在经营管理这些数据都能产生直接的价值作用。尤其是手工采集的数据直接就花费了人工成本,其更有价值。
4、 单一性
数据类型和互联网数据类型相比,比较单一,绝大多数都是文本数据,少数为图片、视频信息等。而互联网的大数据类型要比小数据多的多。
小数据依旧成为计算机应用系统中最有价值的数据。因此,充分利用小数据,发挥小数据的价值作用,其前景依然光明。