职位描述
联泰集群(北京)科技有限责任公司
【单位简介】联泰集群(北京)科技有限责任公司(下称“联泰集群”),2008年5月成立,专注研发设计高性能计算机,小型超算异构计算产品先行者,国家专精特新“小巨人”企业,国内领先的数字经济算力基础设施提供商。
联泰集群专注提供计算力,用计算力推动生产力。公司以“满足用户计算速度体验”为要务,提供异构计算产品、高性能存储产品和集群产品,业务覆盖全国,面向全球,在香港、上海、深圳、苏州、南京、西安、郑州、山东、三河等地设立分子公司。在传统互联网、云计算和新锐短视频、人工智能、区块链、城市智慧大脑、元宇宙等应用领域场景,产品额定条件下速度优于竞标对手50%以上,赢得互联网云计算头部商业巨头青睐;在科学计算领域,产品获得中科院、北大、清华等科研院所高度认可,先后服务算力需求高端用户几千家。
公司持续研发投入,夯实公司核心竞争优势。在拥有顶级科学家研发团队的同时,与清华、北大等相关科研机构,持续保持着深度的技术交流合作。2020年,国际人工智能性能排行榜AIPerf500首次发布,联泰集群设计和部署的三套算力系统包揽二、三、四名,产品研发和定义能力得到业内高度评价。近期,公司与“京津冀国家技术创新中心”共建“高速智能网络技术实验室”,合力解决国内核心技术瓶颈。同时,联泰集群已荣获北京市“专精特新”小巨人称号。
与自身业务高速增长呼应,联泰集群受到股权资本青睐。资方不仅有海淀政府的海华前沿科技、北大旗下的协同创新投资加持,股权投资机构清科产投、腾鼎资本、三河金创也先后注资。
【单位性质】民营企业
【所属行业】计算机服务(系统/数据/维护/安全)
【规模】50-150人
【职位描述】
主要职责:
1. 超算中心的日常维护与管理:负责超级计算机的日常维护与管理工作,包括超级计算机的开机、关机、运行状态监测等,确保超级计算机的正常运行。
2. 超算中心的故障排除与修复:负责超级计算机的故障排除与修复工作,包括硬件故障和软件故障的处理,及时解决计算节点、网络设备等故障,确保超级计算机的稳定运行。
3. 超算中心的性能优化与调整:负责超级计算机的性能优化与调整工作,根据用户需求和实际情况,优化超级计算机的配置和参数,提高超级计算机的运行效率和性能。
4. 超算中心的系统升级与维护:负责超级计算机的系统升级与维护工作,包括操作系统的升级、软件的更新、安全补丁的安装等,确保超级计算机的系统安全与稳定。
5. 超算中心的资源管理与调度:负责超级计算机的资源管理与调度工作,根据用户需求和计算任务的优先级,合理分配超级计算机的计算资源,确保资源的高效利用。
6. 超算中心的用户支持与培训:负责超级计算机用户的支持与培训工作,解答用户在使用超级计算机过程中遇到的问题,提供相关的技术培训和指导,提高用户的使用能力。
7. 超算中心的安全管理与风险评估:负责超级计算机的安全管理与风险评估工作,制定超级计算机的安全策略和措施,评估超级计算机的风险状况,做好系统的安全防护工作。
8. 超算中心的数据备份与恢复:负责超级计算机的数据备份与恢复工作,制定合理的备份策略,定期对超级计算机的数据进行备份,并能够在数据丢失或损坏时进行恢复。
【职位要求】
1. 本科及以上学历,计算机科学、信息技术等相关专业。
2. 具备2年以上华为、超微等服务器上架及维护经验,熟悉常见的操作系统(ubuntu,centos),自动化运维工具(pssh/ansible)等软件。
3. 具备2年的高性能集群管理和搭建能力,熟悉调度软件(PBS/SLURM)
4.具备良好的沟通能力和团队合作精神,能够与团队成员和用户保持良好的合作关系。
5. 具备较强的学习能力和问题解决能力,能够不断学习和掌握新的技术和知识。
【专业要求】
计算机科学、信息技术等相关专业
【薪资情况】
8k-15k
【联系方式】
张红淼
18612205697
010-82641248
专业要求