数据科学与大数据分析中心
十大菠菜台子内多个单位的合作研究论坛, 数据科学和大数据分析中心促进使用大数据分析技术的多学科数据科学研究. 该中心结合了生物和生物医学科学领域科学家的专业知识, 以及数学和统计学的研究人员, 工程, 商业和金融. 这些专家使用尖端的分析方法, 信息学和计算方法进行研究和开发创新的解决方案,以解决跨学科的高影响问题. 除了作为一个研究中心强调在各个学科的定量数据为基础的研究, 该中心的专家与其他学科的研究人员合作,为他们提供分析支持. 该中心的专家也可以为外部行业和企业提供咨询.
该中心的研究重点是医疗运营分析, 工业和金融分析, 基因组和进化生物学研究, 传感器网络和物联网. 该中心及其研究人员还与行业和其他机构密切合作,以解决当前和趋势问题.
传统的医疗保健分析包括使用患者和操作数据来进行统计和定量分析, 建立解释和预测模型, 以及基于事实的管理,以推动医疗保健决策和行动. 它与用途广泛相关, 研究, 创建或合成信息工件,如数据库, 知识库, 数学/统计模型, 数据集成和转换工具以及整个决策支持系统.
医疗保健分析的主要目的是通过获取更好的信息来改进管理决策. 然而, 产生的医疗数据的数量和数据的异质性使得传统的分析效率低下,特别是考虑到许多数据是非数字的事实. 例如, 医生和护士写的笔记, 图片, 视频包含有价值的信息,需要在分析中加以考虑. 然而,目前的工具没有足够的机制来整合不同类型的数据.
作为这个研究流的一部分, 该中心将专注于开发收购基础设施, 整合和分析医疗保健数据以支持决策制定.
预期的输出:
- 用于从不同来源获取和集成医疗保健数据的体系结构
- 保护隐私的数据分析方法
- 概念验证原型演示
以汽车工业及其一、二级供应商产业为依托, 有大量的大数据在等待分析. 而大公司则有一些技术研究中心, 虽然不足以达到目的, 较小的行业完全缺乏资源或人力来处理他们的大数据. 十大菠菜台子的数据科学和大数据分析中心将作为不同学科和行业之间的桥梁,并提供分析服务.
预期的输出:
- 与汽车及其他相关行业合作研究共同感兴趣的问题.
- 以大学为基础的咨询服务中心,以统计实验指导汽车工业, 数据分析和定量方法.
- 为地方和国家工业开发定量数据分析的短期培训项目.
- 与企业合作发展学生实习项目.
本研究侧重于将多变量和贝叶斯方法应用于大数据问题,特别是金融问题. 这些数据集非常庞大, 超过数千只股票, 共同基金, 交易所交易基金和其他金融工具,并按日间隔数年收集, 小时或分钟,甚至更高的频率. 多年来以每分钟频率或每次股票价格变化(通常称为tick)为基础收集的各种金融工具和指数的庞大数据量以及各种股票价格变化的相互关联性构成了巨大的挑战. 股票分割等事件进一步加剧了这种复杂性, 合并, 股票在一些公司死亡时离开空间,新股票在新公司成立时进入空间. 研究市场行为或预测的挑战只能通过综合数据来解决,而不是以每只股票为基础. 考虑到数据的复杂性,只有通过适当的技术才能对这种相关数据进行分析, 这些技术必然需要大量的计算机. 用贝叶斯和马尔可夫链蒙特卡罗方法对这些数据进行建模, 将开发分析这些数据的新方法. 进一步, 这样的问题必然需要特殊的专业知识, 强大的计算能力和特殊的分析能力. 本研究的一个具体目标是对财务数据进行高效有效的分析.
预期的输出:
- 开发能够可靠地预测金融市场行为的新技术.
- 统计套利技术的发展-人们可以决定何时以及哪种金融工具将表现更好.
- 为外部公司提供财务建议.
- 开设新课程——可能会在数学系与工商管理学院之间交叉开设,并探索开设新的学位或证书课程.
本研究侧重于研究/鉴定导致心血管疾病的基因突变. 具体地说, 本研究将使用小鼠致敏全基因组ENU突变筛选来鉴定涉及几种心血管疾病发病机制的基因,包括静脉血栓栓塞, 心脏病和其他血管闭塞性疾病,如镰状细胞性贫血. 全基因组测序用于识别突变, 因此,这项研究每次实验都会产生价值tb的基因组测序数据. 产生的大量基因组序列数据需要计算密集型分析和数据存储. 数据科学和大数据分析中心旨在开展基因组学的前沿研究,并为开放大学的教职员工和学生提供重要的研究和培训机会.
预期的输出:
- 心血管基因组研究项目将产生与心血管疾病有关的基因. 这些信息将用于改进心血管疾病的诊断和治疗.
- 全基因组测序数据分析的新方法可能会被开发出来.
- 拟议的工作将导致出版物和申请外部资金.
- 这项工作很可能产生知识产权, 使大学能够获得必要的收入,为未来的研究工作或中心提供资金.
该流广泛关注使用大数据集的全计算进化研究. 它由两个应用研究领域组成,并以强大的理论研究为支撑. 这项研究的主要目标之一是通过系统发生树来探索生命的进化, 特别关注早期微生物生命的进化. 它需要处理从现有数据库中获得的数千个测序基因组,并重建大型进化历史. 这一研究流的第二个目标是探索基因型和表型之间的相关性,特别关注致病物种. 这需要使用完全测序的基因组和技术来重建过去的进化步骤(祖先状态重建)。, 哪些可以通过密集的计算应用来计算. 这两个目标都得到大规模模拟的支持,这些模拟允许在受控环境中测试获得的估计的准确性,并优化方法和软件实现. 这项研究将极大地受益于一个可以利用其他大数据科学家的专业知识来设计新的和创新的方法来分析/可视化数据的场所, 并对结果的显著性进行统计学评价.
预期的输出:
- 准确重建生命早期阶段,了解微生物群落如何与大规模环境变化相互作用, 比如那些发生在地球早期历史上的事件.
- 破译基因组中导致特定表型的元素, 比如致病的生活方式. 重点将放在疟疾的病原体(疟原虫)上,因为全世界都对这种疾病感兴趣,而且已有详细的基因组信息.
- 理论支持导致算法和软件实现的优化以及模拟数据集,以探索多个参数的影响,并为科学界提供系统发育和基因组分析的最佳实践指导.
医疗保健: 为了提高生活质量, 无线和有线传感器网络技术被认为是计算机科学和医疗保健应用行业的重点研究领域之一. 在一个拥有许多医院的地区,从病人那里收集的数据量是巨大的,而且每分钟都在增长. 分析传感器数据(心电图、血液检查结果、疾病、治疗、过敏等).)病人过去几年的资料及现时的价值, 识别相似的患者并与他们的治疗和反应进行比较对于高质量的卫生保健非常重要. 我们的研究包括, 小尺寸的设计与开发, 低功耗和精确的数字传感器, 收集的各种数据在适当的时间间隔, 以适当和安全的格式存储在大型存储库中, 数据挖掘算法, 测试和实现.
物联网: 物联网(IoT)是物理对象的网络, 设备, 车辆, 嵌入电子设备的建筑物和其他物体, 软件。, 传感器, 网络连接. 这些对象收集和交换数据. 目前, 各行各业都在开发物联网设备,比如将前门锁连接到互联网, 车库开门器, 冰箱等. 到互联网和任何可能的物体. 这种进化是强加给我们的,我们需要担心的不仅仅是这项技术的安全性, 还有每一微秒产生的大量数据. 由于历史原因和分析客户的趋势或行为,物联网设备产生的一些数据需要存储. 汽车制造商正朝着联网汽车的方向发展. 这些汽车将相互通信,也将与互联网通信,并将来自汽车的各种数据存储在一个巨大的数据库中. 该数据库可能由通用、福特等汽车公司单独维护. 分析汽车在不同道路、天气和交通状况下的性能. 这需要大数据分析.
基于云的制造: 在制造工厂, 各种机器连接到互联网,这些机器的传感器值存储在云中,并带有时间戳. 这允许研究机器的行为,这些机器的状态等. 该分析用于机器的状态维护, 产品质量分析, 停机时间分析,提高生产效率. 我们研究基于云的制造和数据分析这些大数据.
预期的输出:
- 我们的传感器网络研究将提高医疗保健的质量,并为拯救生命提供更快的反应. 这项研究将导致期刊发表和博士奖.
- 物联网的研究将有助于提高嵌入式系统的安全性, 防止身份盗用, 帮助预防汽车事故和交通堵塞. 这对密歇根州和世界各地的工业都很有用. 这项研究将导致期刊发表和博士奖.
联合主任
Vijayan Sugumaran博士.D. 更多关于博士的信息. Sugumaran Vijayan Sugumaran 是十大菠菜台子管理信息系统特聘教授和决策与信息科学系系主任, 罗彻斯特 密歇根, 美国. 他也是十大菠菜台子数据科学和大数据分析中心的联合主任. 他获得了博士学位。.D. 美国维吉尼亚州费尔法克斯市乔治梅森大学资讯科技学士学位. 主要研究方向为大数据管理与分析, 本体和语义Web, 智能代理和多代理系统. 他在期刊、会议和书籍上发表了250多篇同行评议的文章. 他编辑了20本书,并在8家期刊的编辑委员会任职. 他曾在《十大菠菜台子》等顶级期刊上发表文章, ACM数据库系统汇刊, ACM通讯, IEEE大数据汇刊, IEEE工程管理汇刊, IEEE教育汇刊, 和IEEE软件. Dr. Sugumaran是《十大菠菜软件》的主编. 他是美洲信息系统会议(AMCIS 1999-2021)智能代理和多代理系统迷你轨道的主席。. Dr. Sugumaran曾担任第14届电子商务研讨会(WeB2015)的项目主席。, 自然语言在信息系统中的应用国际会议(NLDB 2008), NLDB 2013, NLDB 2016, 和NLDB 2019), 第29届澳大利亚信息系统会议(ACIS 2018), 第14届中西部信息系统协会年会(MWAIS 2019), 第五届IEEE大数据服务与应用国际会议(BDS 2019). 他还经常担任众多国家和国际会议的项目委员会成员. | |
Ravindra Khattree博士.D. |
研究人员成立
Fabia U. Battistuzzi, Ph值.D. 更多关于博士的信息. Battistuzzi Dr. Battistuzzi在大型进化分析方面有10多年的经验. 她的研究小组专注于微生物生命的进化,对早期生命和人类病原体的起源特别感兴趣. 自2012年加入开放大学以来, 她启动了一个强有力的研究项目,涉及本科生和研究生,该项目得到了公开大学基金的支持, 生物医学研究中心, 以及密歇根太空资助联盟. 此外,最近向NASA提交的一项用于进行大数据分析的拨款已被选中. 她还参与了当地学区的许多外展活动. 通过她的研究, 教学, 她的目标是推广数据分析基础知识对高中的重要性, 本科, 以及特别关注女性和少数族裔的研究生,这些群体在STEM领域的代表性很低. 她认为,该中心可以创造必要的环境,为教师和学生提供交流思想和相互学习的机会,并解决实际的研究问题. 这将是建立开放大学作为密歇根州数据分析主要参与者之一的良好的第一步,并将成为未来有才华的教师和学生的强大招聘点. | |
约瑟夫·卡拉汉博士.D. 更多关于博士的信息. 卡拉汉 Dr. 卡拉汉以B的成绩毕业于底特律大学.S. 在会计和特殊联合J.D.-M.B.A. 度. 他在伊利诺伊大学厄巴纳-香槟分校获得会计学博士学位. 乔于1989年从密歇根州立大学加入公开大学. 1995年晋升为终身副教授,2002年晋升为会计学教授. 卡拉汉教授在金融学院任教, 管理和会计信息系统(AIS)领域,并集成了基于模型的应用程序开发,以支持这些学科. 我代表小企业管理局, 他在整个会计课程中开发并整合了先进的信息技术. 他的教学兴趣集中在金融领域, 管理, 及会计资讯系统,. 主要研究方向为大数据管理, 医疗, 系统, 金融市场, 及估价方法. | |
Subramaniam Ganesan博士.D. 更多关于博士的信息. Ganesan Dr. Ganesan在数字计算机系统方面拥有超过30年的教学和研究经验. 1991年至1998年,他担任CSE系主任. 他发表了100多篇期刊论文, 会议论文集发表论文200多篇, 还有3本书. 他在2003年出版了一本关于Java的书. 他为他的DSP书开发了一个带有软件的定制DSP板. 他是IEEE的高级会员, IEEE计算机学会杰出客座演讲者, IEEE区域4技术活动成员和ISPE会员. 他获得了ISAM颁发的终身成就奖. 取消SAE颁发的杰出演讲者奖、ASEE颁发的最佳教师奖和十大菠菜台子. 他组织了许多国际会议. 他是《十大菠菜软件》和《十大菠菜软件》的主编. 在过去的15年里,他一直是SAE世界大会“系统工程”的会议组织者. 主要研究方向为实时系统, 并行体系结构和计算机系统, 汽车嵌入式系统安全和信号处理. | |
兰德尔·韦斯特里克博士.D. 更多关于博士的信息. Westrick Dr. 作为一名技术人员,韦斯特里克在止血和血管生物学研究方面拥有20年的专业知识, 研究生, 做博士后研究, 一位助理教授. 他的研究小组专注于使用小鼠正向基因筛选结合下一代测序(NGS)来识别与心血管疾病有关的基因. 因此, 他在使用大型生物数据集(如全基因组DNA和RNAseq数据)方面拥有丰富的经验. 他还将大数据生物医学成像纳入他的心血管疾病研究. 他在研究项目中使用的方法使他具有独特的资格,能够成功参与开放大学数据科学与大数据分析中心的建设. 他的实验室将重点放在心血管疾病的研究上,这也将促进与牛津大学医学院的合作研究项目的发展. 事实上,已经有两名医学生在他的实验室从事研究项目. 一名学生因其暑期研究经历获得了著名的霍华德休斯医学研究所暑期医学研究员项目资助,另一名学生将在她在实验室任职期间申请类似的项目. 此外,在他的2.在十大菠菜台子的5年里,他培养了5名本科生,2名硕士和1名博士. 他们都参加了大数据分析技术的短期课程,并对通过中心的活动继续发展他们的专业知识感到兴奋. 他的学生曾在国内和国际遗传学和心血管疾病会议上发表演讲,并获得了无数奖项,并获得了自己的独立资助. |
该中心将定期举办活动,将工业界和学术界聚集在一起.
即将来临的事件
请关注未来数据科学和大数据分析中心的活动.先前的事件
十大菠菜台子数据科学和大数据分析中心邀请您参加SAS介绍研讨会. 在这个研讨会上, 学生将学习如何使用SAS进行输入, output, 组织和创建数据,以及如何在没有大量编码的情况下应用各种统计和数学技术进行数据分析.
SAS是科学数据分析和数据管理的黄金标准. 它在世界范围内被工业广泛使用, 企业, 研究机构, 大学, 医院, 保险精算的科学家, 流行病学家,社会和生物医学科学家.
艾略特厅礼堂(242室)
8:30 a.m. -登记和茶点
9 a.m. -欢迎辞
9:15 a.m. - SAS全球学术项目
主讲人:Linda Jordan, SAS研究所
9:45 a.m. -打击假新闻
主讲人:Fijoy Vadakkumpadan, SAS研究所
10:45 a.m. - - - - - -休息
11 a.m. -推荐系统
主讲人:Gene Grabowski, SAS研究所
11:45 a.m. -利用数据分析为国家政策提供信息:评估高等教育的绩效资助有效性
主讲人:道格拉斯·卡尔,十大菠菜台子政治学系
12:15 p.m. -午餐(提供)
1:30 p.m. -分析案例研究和未来趋势
主持人:Scott Smith和Brandon Harrison, WIT公司.
2:15 p.m. -区块链和大型语言模型
主讲人:Naresh Jasotani,谷歌底特律办公室
3 p.m. - - - - - -休息
3:15 p.m. 可解释的AI
主讲人:Deepraj Chauhan,奇迹软件系统
4:00 p.m. 闭幕词
4:15 p.m. -网络会话
艾略特大厅,202室
主讲人:后视镜詹姆斯·哈恩成为, SAS研究所,Vijayan Sugumaran,十大菠菜台子
8:30 a.m. ——登记
9 a.m. -第一部分:SAS Viya中的可视化分析和机器学习模型
中午-午餐(提供)
1 p.m. -第二部分:SAS Viya中的开源集成(Python和R)
4 p.m. -工作坊闭幕
中午至下午2点.m.
艾略特大厅202室
SAS本质上是科学数据分析和数据管理的黄金标准. 它在世界范围内被工业广泛使用, 企业, 研究机构, 大学, 医院, 保险精算的科学家, 流行病学家,社会和生物医学科学家.
这个工作坊对任何处理数据的人都很有用,无论是大数据还是小数据,都可以用于他们的研究项目或课堂作业. 学生将学习如何输入, output, 组织和创建数据,以及如何在没有大量编码的情况下应用各种统计和数学技术进行数据分析.
目标受众: 所有研究人员和学生处理数据.
先决条件: 熟悉电脑和Windows.
中午至下午2点.m.
艾略特大厅223室
本次研讨会的重点是培训用户如何在HPC集群上创建帐户, 访问和运行集群上可用的不同软件, 数据和文件管理, 在集群上安装其他软件和管理项目. 还将提供使用Unix/Linux环境的基本训练.
9:00 a.m. – 4:00p.m.
艾略特大厅,202室
十大菠菜台子数据科学与大数据分析中心和SAS公司. 邀请您参加使用SAS Viya的人工智能和深度学习研讨会. 本次研讨会的重点是可视化分析和在SAS Viya中构建机器学习模型. Viya平台集成了SAS提供的许多工具. 参与者将接触到SAS Studio和Visual Analytics来构建ML模型,如决策树和神经网络. Python和R在Viya中的集成也将被讨论.
这将是一个实践研讨会,参与者将使用SAS Viya为学习者工作, 哪个教育版本是对学生和教师免费提供的. 研讨会将由James L. Harroun, 全球软件领导, SAS研究所, 以及Vijayan Sugumaran教授, 数据科学与大数据分析中心联席主任, 工商管理学院, 十大菠菜台子.
程序
8:30 a.m. ——登记
9:00 a.m. -第一部分:SAS Viya中的可视化分析和机器学习模型
中午-午餐(提供)
1:00 p.m. -第二部分:SAS Viya中的开源集成(Python和R)
4:00 p.m. -工作坊闭幕
由数据科学与大数据分析中心和悉尼科技大学主办
11 a.m. 到1p.m.
艾略特大厅223室
本次研讨会的重点是培训用户如何在HPC集群上创建帐户, 访问和运行集群上可用的不同软件, 数据和文件管理, 在集群上安装其他软件和管理项目. 还将提供使用Unix/Linux环境的基本训练.
8:45 a.m. – 12:45 p.m.
虚拟研讨会
程序
8:45 a.m. -欢迎辞
Vijayan Sugumaran, 决策部 & 十大菠菜台子信息科学专业
C. 米歇尔·Piskulich 十大菠菜台子临时教务长
8:50 a.m. ——十大菠菜台子校长的评论
Ora Hirsch Pescovitz, 十大菠菜台子校长
9 a.m. -第一部分:主持人- Randall Westrick
垃圾进垃圾出? COVID-19抗体检测、Pol-II CHIP和孤儿儿童视网膜疾病的经验教训
肯尼斯·P. 在研究 十大菠菜台子眼科研究所
9:30 a.m. -基于COVID-19的医学图像分析
考特尼Ambrozic, SAS研究所
10 a.m. -人工智能和COVID-19系统药物重新定位
阿里斯Persidis, Biovista,夏洛茨维尔,弗吉尼亚州
10:30 a.m. -第二部分:开放大学校友小组讨论-分析领域的就业机会
马克·格思里,情报局局长&S和CIO,美国通用公司,奥本山,密歇根州
Gene Grabowski,首席解决方案架构师 & SAS研究所, Inc .数据科学家.
Avanti Tatiraju, Henry Ford健康系统访问技术分析师
艾米·希伯特-麦肯齐,博士后研究员,血液研究所,威斯康星州
11:15 a.m. -第三部分:主持人- Fabia Battistuzzi
对北亚利桑那州废水进行COVID-19爆发预警测试
水晶Hepp, 北亚利桑那大学
11:45 a.m. - COVID-19大流行的统计建模
Bhramar穆克吉, 密歇根大学
12:15 p.m. -人工智能和深度学习在缓解COVID-19中的作用
Franz Salas, Naresh Jasotani, 谷歌
12:45 p.m. ——拉文德拉·哈特里 十大菠菜台子数学与统计学系
观看工商管理学院的课程 YouTube频道 或通过电子邮件向Dr. Sugumaran: sugumara@oakland.或Shannon Johnson的邮箱mjohnson3@hotel-la-casadei.com.
9 a.m. ——中午
程序
9 a.m. -入门SAS:一个指向和点击的方法
中午, 后视镜詹姆斯·哈恩成为, SAS研究所
工作坊闭幕致辞
8:30 a.m. -登记和茶点
9 a.m. -欢迎辞
9:30 a.m. -现代化机器学习管道:SAS®可视化数据挖掘和SAS®Viya™上的机器学习
主讲人:Jesse Lubbert, SAS研究所
10:30 a.m. - - - - - -休息
10:45 a.m. -人口健康信息学
主讲人:Richard Kennedy, OU William Beaumont医学院
11:45 a.m. -午餐(提供)
1:15 p.m. 基于SAS Viya的SAS可视化分析:数据可视化和探索作为大数据分析的切入点
主讲人:后视镜詹姆斯·哈恩成为, SAS研究所
2:15 p.m. - - - - - -休息
2:30 p.m. -数据可视化和故事讲述
主持人:Claudia Jurcan,通用汽车公司
3:15 p.m. -大数据 & 数据科学:它们是什么 & 我们如何使用它们
推荐人:克莱尔·吉尔伯特,Gongos公司.
4 p.m. 闭幕词
8:30 a.m. ——登记
9 a.m. - SAS Kick Start(第一部分)
主讲人:后视镜詹姆斯·哈恩成为, SAS研究所
中午-午餐(提供)
1 p.m. - SAS Kick Start(第二部分)
主讲人:后视镜詹姆斯·哈恩成为, SAS研究所
5 p.m. -结束语
完成上午和下午课程的学员将获得SAS颁发的结业证书.
由Fabia U. Battistuzzi, Subramaniam Ganesan, Ravindra Khattree, Vijayan Sugumaran, Randy Westrick
议程:
9 - 10:15 UNIX基础
10:30 - 11:45 SAS分析与应用
11:45 - 1午餐(提供)
1 - 2:15生物信息学和基因组学
2:30 - 3:45大数据工具
3:45 - 4结束语
除非另有说明,本次活动的演示文稿以PDF格式提供.
介绍
中心目标
Ravindra Khattree博士.D.数学与统计学系
学术报告
心血管基因组研究中的大数据方法
兰德尔·韦斯特里克博士.D., 生物科学系,
地球、基因组和时间:综合进化历史的大数据方法
Fabia U. Battistuzzi, Ph值.D.生物科学系
下一次数字革命
陈志强博士.D.麦克马斯特大学
利用Web资源检测紧急事件的不同状态
Vijayan Sugumaran博士.D.、决策 & 信息科学
物联网,连接汽车和大数据分析
Subramaniam Ganesan博士.D.电气与计算机工程系
杠杆基金统计
拉维·哈特里博士.D.数学与统计学系
行业报告
你准备好改变你的企业文化了吗?
查克·布鲁克斯博士.D.,美国商业银行报告与分析副总裁,
FCA高级分析概述(无法提供演示文稿)
Corey Hardcastle,菲亚特克莱斯勒汽车公司高级分析业务关系经理
分析:实践者的视角
Jason Harper, RXA公司首席执行官
实时数据...战略上的迫切需要(无法提供演示文稿)
杰克·维纳,总统,JW医疗保健的概念
闭幕词
寻求行业合作伙伴
Vijayan Sugumaran
公开大学教授前往印度,通过富布赖特专家项目分享数据科学专业知识
2022年9月28日
Dr. Ravindra Khattree访问了印度拉贾斯坦邦中央大学(CURaj),分享他在数据科学和分析方面的专业知识.
专家们讨论了数据分析在大流行应对中的作用
2020年10月26日
十大菠菜台子关于数据分析和Covid-19大流行的研讨会介绍了数据对医学的影响, 研究和公共卫生.