-
SAP BI工具的优缺点
所属栏目:[大数据] 日期:2021-01-01 热度:77
虽然市场上BI suite不多,比如Microstrategy和Pentaho,但都一直在和SAP的Business Objects BI Suite竞争。 很多比较领先的BI工具供应商,比如Tableau或者QlikView或许能在某些领域超过SAP,但SAP BI Suite的某些功能还是无法实现。? SAP BI工具最大的优势在[详细]
-
RapidMiner缺失数据处理——去掉数据大量缺失的变量
所属栏目:[大数据] 日期:2020-12-31 热度:189
最近做数据挖掘,发现RapidMiner是一款数据清洗、处理和转换的好工具,尤其在数据量不大的情况下。和R语言相比,RapidMiner在数据处理方面要简单直观得多。虽然RapidMiner的功能可能不如R强大。另外,我们也可以在RapidMiner中可以直接利用Java/Groovy来编写[详细]
-
完整数据团队Tips(关于BI系统、数据仓库、数据挖掘和数据实验的
所属栏目:[大数据] 日期:2020-12-31 热度:148
参考The Strong Data Science Audit: How does your organization's data strategy stack up?一文 分析和仪表盘 使用第三方获取用户行为的工具? 使用Google Analytics、Segment、Heap之类的工具。 有没有明确的用户行为定义,还是说只有PV? 查看PV是了解用[详细]
-
36早报|扎克伯格创造了钢铁侠里的贾维斯 警方用大数据分析抓获18
所属栏目:[大数据] 日期:2020-12-31 热度:98
Hi,早上好,亲爱的小伙伴们,昨天是冬至节,你有吃饺子吗? 都说冬至节不吃饺子耳朵会被冻掉哦~先上一张我小时候吃饺子的照片,有没有满满的既视感→→? 过完了冬至节,马上就要迎来平安夜,圣诞节,元旦节,春节…… 好吧,这似乎和大数据没啥关系?不不[详细]
-
大数据处理分析工具
所属栏目:[大数据] 日期:2020-12-31 热度:172
hadoop Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是[详细]
-
bfprt算法,中位数的中位数算法,O(n)时间复杂度求解第k大数
所属栏目:[大数据] 日期:2020-12-31 热度:175
215. Kth Largest Element in an Array 题目地址 https://leetcode.com/problems/kth-largest-element-in-an-array/ 题目描述 Find the kth largest element in an unsorted array. Note that it is the kth largest element in the sorted order,not the kt[详细]
-
棋盘覆盖。大数
所属栏目:[大数据] 日期:2020-12-31 热度:174
棋盘覆盖 时间限制: 3000 ?ms ?|? 内存限制: 65535 ?KB 难度: 3 描述 在一个2 k ×2 k (1=k=100)的棋盘中恰有一方格被覆盖,如图1(k=2时),现用一缺角的2×2方格(图2为其中缺右下角的一个),去覆盖2 k ×2 k 未被覆盖过的方格,求需要类似图2方格总[详细]
-
BI入门经典
所属栏目:[大数据] 日期:2020-12-31 热度:186
【前言】 ?????昨天论坛的SQL Server大版新增了一个BI板块,大家讨论得热火朝天,由于此前因为客户环境的问题,一直在使用sql 2000,没怎么关注这一块的东西,最近刚好要做购物篮的分析,所以到网上搜集了一些资料。为了跟大家保持“步调一致”,也写点或转[详细]
-
为什么说OLAP产品毁了BI?
所属栏目:[大数据] 日期:2020-12-31 热度:197
? ? ? ?企业为了确定经营战略和市场战略所进行的经营活动,在BI项目的分析决策过程中,需要基于多种报告和报表进行分析。理想的市场活动展开,大多需要各个营业点的销售报表,每种商品按季节销售的业绩图表等,这就需要大量准确的并且易于判断的数据。 然而[详细]
-
大道至简的数据处理工具-(Microsoft Power Query入门)
所属栏目:[大数据] 日期:2020-12-31 热度:51
大道至简的数据处理工具-Microsoft Power Query 告别复杂的excel函数,excel VBA编程,让一切回归简单与职能。 什么样的人群适合这样的一个工具: 1、出纳、会计、统计、仓管、数据分析等与数据打交道的的岗位。 2、不想学处理数据的函数、VBA编程等复杂的功[详细]
-
数据处理方式与控制程序方式不同
所属栏目:[大数据] 日期:2020-12-31 热度:89
结构化方法是直接通过程序来处理数据,处理完毕后即可显示处?理结果,在控制程序方式上是按照设计调用或返回程序不能自由导航,?各模块程序之间存在着控制与被控制的关系;面向对象方法将数据与?对应的代码封装成一个整体,原则上其它对象不能直接修改其数据[详细]
-
视音频数据处理入门:AAC音频码流解析
所属栏目:[大数据] 日期:2020-12-31 热度:196
===================================================== 视音频数据处理入门系列文章: 视音频数据处理入门:RGB、YUV像素数据处理 视音频数据处理入门:PCM音频采样数据处理 视音频数据处理入门:H.264视频码流解析 视音频数据处理入门:AAC音频码流解析[详细]
-
推荐 :0岁数据分析师的入门指南
所属栏目:[大数据] 日期:2020-12-31 热度:55
初入数据分析行业的同学或还在门口徘徊想要从事数据分析职业的同学常常会比较困惑,非常迫切地想要知道作为一个数据分析师,到底需要掌握那些技能,这里笔者作为过来人给到大家一点建议。(注意这里适用的是互联网行业的数据分析师,不一定适合传统行业。)[详细]
-
[bigdata021- python3转换json数据的单引号双引号注意点]
所属栏目:[大数据] 日期:2020-12-31 热度:92
在py3里,一个json是一个字典,形如 {"a":15} 那么,如果你要将它转换成字符串,也许你用的是str({"a":15}),这样转出来的,可能是是s= "{'a':'15'}",也就是说,里面的kv是单引号的。这个字符串,传到其他地方,再用json.loads(s)的时候会出错,json不支持[详细]
-
使用R语言挖掘QQ群聊天记录
所属栏目:[大数据] 日期:2020-12-31 热度:177
数据挖掘入门与实战 ?公众号: datadw 1、获取数据 从 QQ 消息管理器中导出消息记录,保存的文本类型选择 txt 文件。这里获取的是某群从 2016-04-18 到?2016-05-07 期间的聊天记录,记录样本如下所示。 2、数据预处理 打开 R 软件,先通过 File—Change dir[详细]
-
视音频数据处理入门:PCM音频采样数据处理
所属栏目:[大数据] 日期:2020-12-31 热度:102
===================================================== 视音频数据处理入门系列文章: 视音频数据处理入门:RGB、YUV像素数据处理 视音频数据处理入门:PCM音频采样数据处理 视音频数据处理入门:H.264视频码流解析 视音频数据处理入门:AAC音频码流解析[详细]
-
Kahan#39;s Summation Formula原理—它是如何避免大数吃小数的
所属栏目:[大数据] 日期:2020-12-30 热度:111
Kahan求和公式原理: ? ? ? ?首先,这个算法就是用来求和的,求a1+a2+a3+...为什么不直接相加呢,而要用Kahan求和公式呢,这个算法的用武之地在哪呢,一一道来 ? ? ? ?kahan求和算法能避免大数吃小数的情况。 ? ? ? ?大数吃小数是什么意思呢?举个例子,我们[详细]
-
盘点丨2016年乐视开过的发布会和许chui过的愿niu景bi
所属栏目:[大数据] 日期:2020-12-30 热度:68
在辞旧迎新之际,2016盘点系列也将接近尾声,今天我们来盘点一下 乐视在2016年开过的那些发布会和许chui过的愿niu景bi。 北京时间1月12日,乐视在北京798艺术区召开主题为“生态世界”的全球品牌升级新闻发布会,公布了乐视生态及7大子生态的全新Logo,宣布[详细]
-
[bigdata-018] java spring 快捷入门
所属栏目:[大数据] 日期:2020-12-30 热度:94
1. spring学习,最好的材料是官网 http://sping.io/docs 2.安装jdk 3. 安装tomcat http://blog.csdn.net/zhuying_linux/article/details/6583096/ tomcat 8.5对应的jdk 1.7 把tomcat压缩包放到~/usr/tomcat里 在/etc/profile加上CATALINA_HOME=/home/brian/u[详细]
-
bzoj 3100 K大数查询 树套树
所属栏目:[大数据] 日期:2020-12-30 热度:123
外层权值线段树,对于每个权值线段树节点,建立区间线段树。但是内层这样普通建树会TLEMLE。仔细想会发现,区间线段树不用都建出来,用到哪个点就开哪一个点,每次操作最多经过logn个权值线段树节点,访问每个权值线段树节点时,最多修改logn个区间线段树节[详细]
-
[bigdata-019] 禅道在linux上的安装
所属栏目:[大数据] 日期:2020-12-30 热度:92
1. 在ubuntu 14.04上安装部署禅道 ?? 2. 禅道有多种安装方式。有一键安装包。但如果你已经有了一个mysql数据库,就不能使用一键安装了。本文主要说明在已有mysql数据库下的安装。 3. 官方参考 http://www.zentao.net/book/zentaopmshelp/239.html 4. 下载,[详细]
-
从0到1构建数据生态系列之六:数据价值挖掘
所属栏目:[大数据] 日期:2020-12-30 热度:156
文·blogchong 这估计《 从0到1构建数据生态系列 》的最后一篇,主题是数据价值。 在之前,我们所有做的一切一切,都是基础,那么其最终的目的是什么? 当然,结果很明显,就是数据价值,那么,作为数据生态的最上层,所谓的数据价值又是以什么形式体现的呢[详细]
-
这5种必知的大数据处理框架技术,你的项目到底应该使用其中的哪
所属栏目:[大数据] 日期:2020-12-30 热度:184
大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性、规模,以及价值在最近几年才经历了大规模扩展。 本文将介绍大数据系统一个最[详细]
-
[bigdata-020]用python3+pymogo 操作 mongodb数据库
所属栏目:[大数据] 日期:2020-12-30 热度:196
1. 安装pymongo pip install pymongo 2. 写一个例子 #!/usr/bin/env python3#! coding:utf-8 -*-import pymongoimport timeclient = pymongo.MongoClient('localhost',27017)db = client.get_database('user-behavior-data')print(db.name)backend = db.get_[详细]
-
bzoj 3110 K大数查询 整体二分
所属栏目:[大数据] 日期:2020-12-30 热度:70
#includecstdio #includeiostream #define maxn 50005 #define LL long long using namespace std; int n, m ;struct Que{ int op,l,r, x ,id; void read () { scanf( " %d %d %d %d " ,op,l,r, x ); if (op== 1 ) x +=n+ 1 ; }} q[50005] ;Que q1[maxn],q2[[详细]