智能钛弹性模型服务(TencentIntelligence Elastic ModelService,TI-EMS)是具备虚拟化异构算力和弹性扩缩容能力的无服务器化在线推理平台,能够帮助客户解决模型部署复杂、资源浪费、手工扩展资源效率低下的问题。客户通过使用智能钛弹性模型服务可以实现模型一键部署,自动调整弹性计算资源,在保障线上业务稳定运行的节约成本。智能钛弹性模型服务具备的多模型支持、版本管理和灰度升级等丰富完善的功能,使得客户能够轻松地对线上模型服务进行运维管理和监控。
功能
智能钛弹性模型服务 TI-EMS 提供一键部署、自动弹性扩缩容、细粒度算力分配等功能。
一键部署不同类型模型
支持 CPU、GPU 算力虚拟化,可以一键部署不同类型的机器学习模型和深度学习模型。
自动弹性扩缩容
支持手动或自动调整弹性实例扩展策略,根据业务负载情况,动态实时自动管理实例数量,以Zui合适的实例数量应对业务情况。
细粒度算力分配
智能钛弹性模型服务可以提供小至0.1核级粒度的算力,通过细粒度算力分配提供高性价比服务。
优化加速
智能钛弹性模型服务支持模型和框架的优化加速,可以提升模型服务运行效率,提供推理性能。
版本管理
智能钛弹性模型服务支持模型多版本管理,使用智能钛弹性模型服务可以对模型的不同版本进行静态配置的管理。
灰度升级
智能钛弹性模型服务的部署管理可以轻松实现带有流量管理功能的灰度发布,用户可以方便地在智能钛弹性模型服务上进行 A/Btesting。