-
打破数据统一的七大原则
所属栏目:[大数据] 日期:2018-04-12 热度:129
数据统一在数据分析领域里是个长期的挑战,从事数据分析的从业者希望在数据分析之前,来自不同实体的数据能够在同一个地方呈现出来。数据统一由七部分组成:1、获取数据 2、清洗数据 3、转换数据、4、模式集成 5、重复数据删除、6、分类 7、导出 一般而言[详细]
-
物联网下:大数据属于谁?
所属栏目:[大数据] 日期:2018-04-12 热度:66
数据隐私与访问的讨论在物联网时代变得越来越复杂 在之前一些文章中,我已经警告过一些组织机构机构可能很快就会遭遇数据问题被锁定、赶出或以其他方式禁止访问,以有助于优化未来业务的关键新数据源的可能性。 虽然我相信每个数据驱动的组织机构现在就应[详细]
-
大数据趋势下如何实现NAS存储与容灾备份?
所属栏目:[大数据] 日期:2018-04-12 热度:106
1、数据量暴增,存储市场风云变幻 据IDC预测,全球的数据量正面临一个爆炸性增长,到2020年即将达到44ZB,那44ZB是个什么概念呢? 如果以1KB=1024MB计算,1ZB的数据量换成 128G iPad的高度,可达地球到月球距离的6.6倍。 这些数据中,90%的增量来自于非结构[详细]
-
数据清洗的经验与教训 Data Cleaning
所属栏目:[大数据] 日期:2018-04-12 热度:169
小学的时候我统计过同学里有多少要订课间牛奶:每人分别需要什么口味和什么大小,应收多少钱。最后这份按照座位排序的表格要和一张学号表格按照同学姓名对应起来,并计算每种口味订购数量和每人应收款。过程中我遇到了很多困难,例如有同学订了多种口味,[详细]
-
被大数据遗忘的基础奠基-Log
所属栏目:[大数据] 日期:2018-04-12 热度:135
在大数据时代,Log是关系数据库对计算机行业的伟大贡献,更是基础技术之一。然而在大家热烈讨论GFS, NoSQL,乃至Paxos, LSM tree等词语的时候,Log这个基础技术以及它对大数据行业的巨大贡献却一直以来都被业界所忽略。除了Kafka作者之一Jay Kreps2013年[详细]
-
如何在多系统和网络拓扑中构建高性能模型?
所属栏目:[大数据] 日期:2018-04-12 热度:79
这个文档和附带的脚本详细介绍了如何构建针对各种系统和网络拓扑的高性能可拓展模型。这个技术在本文档中用了一些低级的 Tensorflow Python 基元。在未来,这些技术将被并入高级 API。 输入管道 性能指南阐述了如何诊断输入管道可能存在的问题及其最佳解决[详细]
-
大数据“喂养”红利下,知识图谱如何走上新道路?
所属栏目:[大数据] 日期:2018-04-12 热度:148
大数据时代的到来,为人工智能的飞速发展带来前所未有的数据红利。在大数据的喂养下,人工智能技术获得了前所未有的长足进步。其进展突出体现在以知识图谱为代表的知识工程以及深度学习为代表的机器学习等相关领域。随着深度学习对于大数据的红利消耗殆尽[详细]
-
服务端开发指南与最佳实战:数据存储技术,MySQL 数据库安全性
所属栏目:[大数据] 日期:2018-04-12 热度:174
数据库的安全性,即保护数据库,防止未经授权或不合法的使用而造成的数据泄漏和更改破坏。因此,保护数据库的安全性的一般方法是设置用户标识和权限控制。 MySQL 权限控制,分为两个步骤。第一步骤,服务器会检查是否允许连接。因为创建用户的时候会加上主[详细]
-
TensorFlow的开源与Hadoop的开源有什么不同?
所属栏目:[大数据] 日期:2018-04-12 热度:84
最近看TensorFlow代码的时候,用Git pull下来最新的master一看,哇好多的更新,然后点击去之前看到一半的cc文件继续看,好多地方都改变了。但是一看Git log,有好多巨大的commit叫什么 Merge commit for internal changes, Merge for github,没有任何的其[详细]
-
最适合Java开发者的大数据工具和框架
所属栏目:[大数据] 日期:2018-04-12 热度:197
当今编程人员面对的最大挑战就是复杂性,硬件越来越复杂,OS越来越复杂,编程语言和API越来越复杂,我们构建的应用也越来越复杂。根据外媒的一项调查报告,以下列出了Java程序员在过去12个月内一直使用的一些工具或框架,或许会对你有意义。 先来看看大数[详细]
-
新华三成就成都古街老巷的智慧转身
所属栏目:[大数据] 日期:2018-04-09 热度:57
成都,被称作是来了就不想走的城市。在这座舒适、安逸的城市,遍布青砖黛瓦的宽窄巷子和锦里古街则是每一位游客都不能错过的历史文化古迹。锦里古街曾经是西蜀最古老、最具商业气质的街道之一,而诞生于清朝康熙年间宽窄巷子也同样是历史悠久的商业胜地。[详细]
-
大数据时代,何来隐私
所属栏目:[大数据] 日期:2018-04-09 热度:77
数据影响力正在不断增强。网络上的个人信息帮助特朗普赢得了总统竞选,而民众的在线身份一次又一次的让Facebook突破底线。 但由于美国大选以及最近揭露的Facebook数据泄密丑闻,不仅引来了联邦贸易委员会的调查,还让在线消费者和立法者对数据在我们生活中[详细]
-
杨元庆雷军两会看好人工智能
所属栏目:[大数据] 日期:2018-04-09 热度:179
人工智能,成为今年全国两会上互联网大咖们关注的热点。3月8日上午,履新全国人大代表的联想集团董事长兼CEO杨元庆,和连任全国人大代表、小米科技董事长雷军共同出席北京代表团全体会议。 杨元庆和雷军发言时,都对人工智能表现极大兴趣,并表示其掌舵的企业将[详细]
-
为防止用户被假冒,Facebook正式部署人脸识别功能
所属栏目:[大数据] 日期:2018-04-09 热度:71
Facebook已经开始面向全球用户推出人脸识别功能,不过由于当地法律限制,欧盟和加拿大的用户将不包括在内。其实在去年12月份,就已经预告称Facebook很快会应用人脸识别功能,一定程度上能够有效防止用户身份被他人假冒。 使用新的人脸识别功能,你能够找到[详细]
-
人工智能的五大思想流派,你支持哪一派?
所属栏目:[大数据] 日期:2018-04-09 热度:171
未来的就业形势还能依靠科技巨头和首席执行官们来决定,而人工智能的未来,依旧充满了太多的不确定性。 这一状况是源自于人工智能及其在科技行业日益增长的存在所带来的不确定性?或者,这是归结于使用人工智能所带来的潜在变化?不管是哪种情况,似乎没有[详细]
-
2018年最值得关注的15大技术趋势:人工智能、区块链、5G……
所属栏目:[大数据] 日期:2018-04-09 热度:174
通常情况下,技术趋势是很难准确预测的,因为预测未来本身就极其困难。但是我们还是可以从2017 年的一些显著的数据指标来推测2018年科技行业的一些发展趋势的。 许多人对科技行业概念的理解过于具体和狭隘了,他们只将如智能手机、无人机等视为科技行业,[详细]
-
IBM和Unity联手将Watson的AI引入VR/AR游戏中
所属栏目:[大数据] 日期:2018-04-09 热度:74
IBM和Unity宣布建立合作伙伴关系,将Watson的AI功能引入到世界上最流行的内置VR/AR功能的游戏引擎中。 IBM公司的Watson Unity SDK可以在Unity Asset商店中免费下载获得。Unity开发人员可以访问Watson套件的人工智能功能。这意味着数百万开发者现在可以相对[详细]
-
AI和大数据2017“成长的烦恼”
所属栏目:[大数据] 日期:2018-04-09 热度:151
人工智能和大数据在2017年的发展遇到了以下10个成长的烦恼,包括:人工智能无IQ标准、人工智能延伸边缘、AI嵌入超算和云计算、大数据风口已过、数据保鲜难等等。 人工智能和大数据在2017年的发展遇到了以下10个成长的烦恼: 1.人工智能无IQ标准 人工智能领[详细]
-
360 宣布关闭水滴直播,但继续送幼儿园 360 智能摄像机
所属栏目:[大数据] 日期:2018-04-09 热度:78
12月20日上午8点多,水滴直播新浪官方微博发布公告,称因内部业务调整,水滴直播自即日起停止运营。360智能摄像机将专注提供可靠的安防监控功能,为用户提供服务。 这一回应也许是92年女生事件的尾声。 不久前,一篇《一位92年女生致周鸿祎:别再盯着我们[详细]
-
亚马逊与甲骨文互撕 透过迷雾看透数据库的江湖恩怨和大势
所属栏目:[大数据] 日期:2018-04-09 热度:51
甲骨文公司CEO兼CTO拉里埃里森(Larry Ellison)历来是甲骨文的一面旗帜,也堪称数据库产业的一面旗帜。虽然他已经有数十年公开抨击竞争对手的历史了,吐槽的对手包括了IBM、EMC、Salesforce等业界大咖,但是绝对不是信口开河、无的放矢,也不是每次都能致[详细]
-
借助深度学习算法,4K 流媒体视频将发展出“新一代内容”
所属栏目:[大数据] 日期:2018-04-06 热度:59
如果你经常在网上看视频,你肯定会遇到过那种正在缓冲的状况。尤其是在情节达到高潮的时候,时不时缓冲一下,真的是让人抓狂不已。此外,最近的一项研究表明,网络上近70%的内容都是流媒体视频和音频。因此,看视频是否需要缓冲,开始变得比以往任何时候都[详细]
-
人们应该知道的大数据术语
所属栏目:[大数据] 日期:2018-04-06 热度:199
Apache软件基金会(ASF):提供了许多大数据的开源项目,目前有350多个项目。是专门为支持开源软件项目而办的一个非盈利性组织。在它所支持的Apache项目与子项目中,所发行的软件产品都遵循Apache许可证。 Apache Kafka:以着名的捷克作家命名的Apache Kafka[详细]
-
研究显示AI正创造更多工作岗位
所属栏目:[大数据] 日期:2018-04-04 热度:108
北京时间17日早间消息,据《福布斯》报道,人们目前普遍认为,人工智能(AI)将导致人类失去工作,造成广泛的人员冗余。但新的研究表明,那些投资于人工智能的企业更有可能创造工作岗位,而不是毁灭它们。 咨询巨头凯捷(Capgemini)调查了1000家部署了人[详细]
-
基于标记数据学习降低误报率的算法优化
所属栏目:[大数据] 日期:2018-04-04 热度:92
无论是基于规则匹配的策略,还是基于复杂的安全分析模型,安全设备产生的告警都存在大量误报,这是一个相当普遍的问题。其中一个重要的原因是每个客户的应用场景和数据都多多少少有不同的差异,基于固定判断规则对有统计涨落的数据进行僵化的判断,很容易[详细]
-
银行信贷大数据管理如何助力地方融资平台财政监督?
所属栏目:[大数据] 日期:2018-04-04 热度:95
2017年财政部50号文、87号文、75号文等不断关注地方融资平台的规范建设与发展,其中对地方融资平台土地融资、金融机构借款与融资平台信贷风险防控等问题给予了较高程度的关注。中国人民银行也于2017年5月成立金融科技(FinTech)委员会,旨在加强金融机构[详细]