Slider Image

大数据对未来产生深刻的影响,目前可以预见的发展趋势,大数据对与统计学的好处有以下两点:

    1.数据科学和数据联盟的成立.数据科学将成为一门专门的学科,数据的重要性不言而喻,统计学也会借此契机迎来新的发展.基于数据基础平台,还建立起跨领域的数据共享平台,之后,数据共享将扩展到企业层面,并且成为未来产业的核心一环.

    2.数据管理成为核心竞争力.数据管理成为核心竞争力后,直接影响财务表现.当数据资产是企业核心资产的概念深入人心后,企业对于数据管理便有了更清晰的界定,将数据管理作为企业核心竞争力,持续发展,战略性规划与运用数据资产,成为企业数据管理的核心.数据资产管理效率与主营业业务收入增长率,销售收入增长率显著正相关.到那时,统计学的相关知识将被广泛的应用在生产生活的各个方面,全面深入的融入人们的生活.



学生端基本功能

  • 查看实验
  • 阅读指导书
  • 提交报告
  • 查看成绩
  • 修改个人信息


教师端基本功能

  • 开始试验
  • 管理班级
  • 设置实验
  • 批阅报告


管理员端基本功能

  • 查看虚拟机
  • 创建、启动、停止虚拟机


29套案例库

序号 案例库名称 案例库简介
1 车辆GPS位置信息大数据案例库 该数据为江苏省南京市出租车从2010年9月1日到2日的GPS位置数据,包含了7,7267辆出租车的共33,042,225条位置记录
2 超市零售大数据案例库 该据为国内某超市从2012年8月1日到2013年8月1日共一年的交易数据,包含了812,847条交易、2,893,385件单个商品以及20,154名顾客。
3 微博消息大数据案例库 该据为新浪微博数据,包含了从2013年6月1日到14日期间的12,102,7441条微博
4 用户上网行为大数据案例库 该据为谷歌(Google)和亚马逊(Amazon)的产品数据
5 电影评分大户及案例库 数据为美国在线影片提供商 NetFlix从1998年10月到2005年12月的电影评分数据,包含了480,1894用户对17,770多部影片的100,480,507条评分
6 加速度测量大数据案例库 该数据集为大量的加速度测量数据。数据集包含训练集、测试集和问题集。实验任务是通过训练,让机器来检测测试集中的加速度是否是由问题集中所声称的设备记录的。
7 车辆保险大数据案例库 通过车辆特征来准确预测保险索赔支付。该数据集包含一系列车辆信息。
8 单词拼写脑电图大数据案例库 该数据集为脑电图记录。人类思考时,发出脑电波,这些脑电波对应实际意图。我们让测试者只注意视觉刺激来拼写单词,并且记录他们的脑电波数据
9 债券交易大数据案例库 数据集包含美国公司债券交易数据。每行包括交易信息,以及已交易的债券和有关过去10次交易信息的一些基本信息
10 脑磁图大数据案例库 该数据集为大量脑磁图记录。训练集共16个主题包括9414个实验,脑磁图和类标签。测试集共7个主题包括4058个脑磁图记录,没有类标签
11 黑盒子学习大数据案例库  数据集的每个实例都有1875个输入特征,并且每个例子都属于9个类型中的一个。训练集包括1000个有标签的例子。测试 集包括10000个例子,分为5000个公共测试和5000个私人测试。我们还提供了额外的135735个无标签的例子,可以用于无监督学习。
12 点击流大数据案例库 十天的click—through数据
13 豆瓣大数据案例库 本数据集为豆瓣数据。豆瓣数据主要是社区数据,基于豆瓣的小组功能,我们选了约1.5万不同规模的小组,然后首先抓取他们的小组成员,然后抓取小组成员的粉丝
14 网站内容大数据案例库 该数据集包含了来自不同的堆栈交换网站的内容
15 问答网站提问大数据案例库 该数据集包含问答网站 StackOverflow的用户提交数据和提交时刻的 元信息
16 文本分类大数据案例库 该数据集为 Tradeshift文本分类。对所有的文档,我们把它分成一个个文本块,每个文本块为一个样本。对于每个样本,都具有一些特征,我们把它们置于训练集和测试集里
17 工作广告大数据案例库 该数据集为大量的个人工作广告,以及每个工作广告相关的一系列字段
18 恶意文件大数据案例库 该数据集包含一系列恶意文件,这些恶意文件属于9个不同的家族。已知的恶意文件集合中,每个恶意文件包含一个Id(一个20字符的唯一hash值),以及一个类型(整数)
19 网络安全日志大数据案例库 所用数据为某企业一周的网络日志数据,包含了46,138,310条网络流数据和3,407,967条状态监控消息
20 广告拦截大数据案例库 预测一段 avito(一个俄罗斯网站)广告是否(因非法内容)被阻止。数据集提供了5个月的广告数据,其中包括被阻止的非法广告和未被阻止的正常广告
21 GAL脑电图大数据案例库 该数据集为“抓取和提起”(简称GAL)动作的脑电图记录
22 粒子碰撞大数据案例库 数据包含碰撞事件及参数,需要预测是否在碰撞中发生了τ→3μ衰变
23 人口普查大数据案例库 美国社区调查是美国人口普查局从事的一个持续的调查。每年约有350万户家庭参与这个调查,他们被详细询问关于他们是谁和他们如何生活。调查也涉及了很多话题,包括祖先、教育、工作、交通、互联网使用和居住
24 大学计分卡大数据案例库  数据集为美国某大学记分卡原始数据
25 旅程大数据案例库 数据对应的文件夹下有许多的文件夹,每个文件夹代表一个司机。每个文件夹内部有200个csv文件,每个文件代表一段旅程
26 带有情感表情的微博大数据案例库 数据为新浪微博带有情感表情的微博数据,包含了从2010年4月到9月期间1万活跃用户的6,193,7036,193,703条 微博以及相应的情感标签(愤怒、厌恶、高兴和低落)
27 出租车运行轨迹大数据案例库 葡萄牙波尔图的442辆出租车的运行轨迹。这些出租车上安装了移动数据终端,由出租车运营中心调控。旅途分为三种:(1)由出租车运营中心指派;(2)由出租车站直接要求搭乘;(3)在随机的街道上要求搭乘。数据集可用于出租车运行路线预测实验和出租车运行平均时间预测实验。
28 农业大数据案例库 该数据是2010年至2016年,全国各地每日发布的小麦出售或求购信息,数据类型包括日期、省市、各个收厂商及价格信息。近20万条数据信息。
29 电子商务大数据案例库 近6万条数据,包括行业,地区,评价,发货信息,信用等级,商品信息,用户信息等。