解决方案顶部轮播图-banner1

什么是大数据

大数据的数量呈现出巨额增长,且时时刻刻从四面八方涌来。电脑、智能手机、虚拟设备和设施等系统和设备都在生成大量数据集,且依靠这些现有的数据集运行。
 

但什么是大数据呢?大数据是一个泛指结构化和非结构化数据集的术语,这些数据集太过庞大和复杂,以至传统的数据处理应用和系统无法充分地进行处理。通常来说,利用大数据可进行预测性分析。通过对数据集进行分析,可以找出新的相关性,从而确定业务趋势、预防疾病、打击犯罪等等。

成功实施大数据项目的障碍

各公司在实施大数据项目的过程中,经常遇到障碍。这些障碍可能包括预算限制、缺乏 IT 专业技能以及平台受限风险。

(1)预算限制

根据 Deloitte 的研究,预算限制和成本是许多公司回避部署大数据的最主要原因。要证明投资新 IT 基础架构以处理大量数据的正当性确实不易,尤其是在企业并没有相关业务案例的情况下更是如此

(2)IT 专业技能

处理大数据工作负载不同于处理典型企业级应用工作负载。大数据工作负载采用平行的处理方式,而不是按顺序处理。IT 通常会优先处理关键业务工作负载,并安排在夜间或者存在多余容量时批量处理优先级较低的作业。但对于大数据分析,很多使用情形必须实时运行以便立即分析并迅速反应。这使 IT 不得不改变数据中心策略,并学习使用用于创建、管理和监控这些新工作负载的新工具。(3)平台受限

各公司需要选择合适的基础架构类型来运行他们的应用和数据。采购硬件需要花时间。对于概念证明而言,采用云计算可能是明智之举,但也伴随着平台受限的风险以及安全问题,而且会大规模地产生巨大成本。Cloudera、Hortonworks、MAPR 和 Pivotal 全都提供了互不兼容的竞争性体系结构,在这种情况下各公司还必须决定选择哪种 Hadoop 版本。有很多决定,一旦做出,公司以后就很难再进行调整,因此很多公司只好一再推迟讨论是否采用大数据。


VMware 在大数据中的作用

无论是物理基础架构还是虚拟基础架构,其作用都是为应用提供支持。这包括传统的关键业务应用以及现代云计算应用、移动应用和大数据应用。

对 Hadoop 等大数据应用进行虚拟化可实现诸多优势,这些优势在物理基础架构或云环境中是无法实现的。简化大数据基础架构的管理可以让您更快地获得结果,从而提高成本效益。如同对传统应用的意义一样,对大数据而言,VMware 同样是最好的平台。


简化大数据管理
对 Hadoop 等大数据应用进行虚拟化可提供诸多优势,这些优势在物理基础架构或云计算环境中是无法实现的。简化大数据基础架构的管理可以更快地取得成效,从而提高成本效益。VMware 不仅是传统应用的最佳平台,更是大数据的最佳平台。

服务器虚拟化
虚拟化是一项经验证的软件技术,借助这项技术,可在同一台服务器上同时运行多个操作系统和应用。虚拟化可以提高 IT 敏捷性、灵活性和可扩展性,同时大幅节约成本。工作负载的部署速度更快、性能和可用性得到提升、运维实现自动化,所有这一切不仅简化了 IT 管理,还降低了拥有成本和运维成本。

确保系统正常运行
vSphere High Availability (HA) 可针对您的虚拟化环境中的硬件和操作系统故障,提供统一且经济高效的故障转移保护,从而最大限度地缩短停机时间。监控主机和虚拟机,在检测到故障时,自动重新启动集群中其他主机上的虚拟机。HA 可为所有应用提供统一的自动保护,无需修改应用或客户机操作系统。
 
共享数据中心资源
vSphere 内容库支持管理员从一个中心位置管理虚拟机模板、vApp、ISO 镜像和脚本。将内容分组整理到可单独进行配置和管理的库中。创建库后,即可跨越 vCenter Server 的边界共享内容,并可确保整个数据中心的一致性。将虚拟机模板直接部署到主机或集群上,以实现一致的调配体验。

优先为虚拟机分配资源
vSphere Network I/O Control (NIOC) 和 vSphere Storage I/O Control (SIOC) 监控您的网络和存储,并根据您设置的规则和策略自动将资源转移到高优先级应用。它延展了熟悉的 CPU 和内存共享和限制结构,通过跨 vSphere 主机集群动态分配 I/O 容量来解决网络或存储使用率问题。它通过减少主动性能管理来提高管理员的工作效率。

集中式网络管理
从一个集中界面跨多个主机和集群调配、管理和监控虚拟网络连接。vSphere Distributed Switch 具有丰富的监控和故障排除功能,包括用于修补和更新网络配置的回滚和恢复功能,以及可用于对虚拟网络连接配置进行备份和还原的模板。

快速部署和调配
主机配置文件(存储 vSphere 主机共享的配置设置)可以连接到一个或多个 vSphere 主机或集群。将主机配置与主机配置文件进行比较,并报告任何偏差,以便自动更正配置偏差。管理员可以创建一次配置文件,然后将其与 Auto Deploy 一起使用,以便快速部署和调配多个 vSphere 主机,从而无需专门的脚本或手动配置。