从国内的996,到美国的朝9晚5
不过,其中掩盖了一些不太重要的细节。例如,服务可能需要不同的技术取决于它是否是实时完成的。可伸缩的解决方案通常将模型放在一个负载均衡器后的服务集群的多个机器上的容器内运行。因此,上述图表中的单个框并不意味着实际平台的单个步骤、容器或组件。 这并不是对图中步骤进行批评,而是一个警示:看似简单的事情在实践中可能并不那么容易。 图表中没有模型(配置)管理。可以考虑诸如版本控制、实验管理、运行时统计、用于培训、测试和验证数据集的数据沿袭跟踪,从头开始或从模型快照、超参数值、精度度量等等对模型进行再培训的能力。 此外,图中缺失的另一个关键点是检查模型偏差的能力,例如,根据不同的维度来分割模型的关键性能指标。许多公司也需要能够热交换一个模型或并行运行多个模型。前者至关重要,可以避免模型在后台更新时,用户的请求进入服务器时失败。而后者对于A/B测试或模型验证也举足轻重。 从CI/CD中我们可以得出另一个观点,它提到了版本化数据和代码的需要,这一点经常被忽略。 谷歌:TFX
谷歌开发TensorFlow eXtended(TFX)的主要动机是将机器学习模型的生产时间从数月缩短到几周。谷歌工程师和科学家为此焦头烂额,因为“当机器学习需要应用于生产时,实际的工作流程将变得更加复杂。” 对于机器学习生产系统而言,只有5%的实际代码是模型本身。将一组机器学习解决方案转变为端到端的机器学习平台的,是一种运用了加速建模、自动化部署和确保生产中的可伸缩性和可靠性的技术的架构。
笔者此前讲过lean D/MLOps,数据和机器学习操作,因为没有数据的机器学习操作是没有意义的,所以端到端机器学习平台需要进行整体构建。CI/CD基金会启动了一个MLOps特别兴趣小组(SIG)。其端到端机器学习平台确定的步骤如下图所示: 如何决定要发送消息还是打电话?Google表示:“视频最适合进行更敏感或更详细的讨论,而快速消息最适合用于签到或澄清简单的问题。” 认识到两者的区别是很重要的。太多的电话会让员工感到精疲力尽,但是太多的信息往来也会消耗大量的时间,尤其是打五分钟的通话可以解决多个问题时。 9. 优先考虑幸福 在新冠疫情期间,健康比以往任何时候都更加重要。认识到这一点,Google建议:
在确保给同事们时间和空间去实际工作的同时,Google建议通过鼓励性的消息、一篇与项目相关的新闻文章或一张有趣的照片与同事打个简短的招呼。你也可以考虑安排一个“虚拟的咖啡休息时间”,就像在办公室里那样,这会给你机会谈论关于你的一天、周末计划,或其他任何事情。 5. 认识你的队友 在远程工作时,要对队友说一句“谢谢”或“干得好”就不那么容易了。Google温馨提示:“一定要给同事发一条祝贺或感谢的信息,在团队会议上分享荣誉,并利用好公司的认可计划。” 6. 邀请同事参与 对于内向的同事来说,参加小组会议会是一个挑战,在虚拟环境中甚至更是如此。团队负责人可以通过直接询问参与者的意见来弥补这一点。在开会时,与参与者的表情和肢体语言保持一致。如果你看到他们可能正在尝试进入对话,请给他们发言的机会。 7. 制定团队规范 谷歌表示:“规范为你如何与团队合作设定了明确的期望。但它们通常只是假设,并不是明确的陈述,这就给理解混淆留下了机会。” Google的研究人员建议与同事讨论团队规范,其中包括:
建立这些规范,将它们记录下来并分发给团队中的每个人,这样做会让每个人都有同感,减轻压力,还可以减少由于一个团队成员在等待其他团队成员而导致的生产率低下的问题。
8. 使用正确的媒介 (编辑:济宁站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |