远不止编码:如何规划组织数据科学及分析项目?

全文共2640字 , 预计学习时长7分钟
远不止编码:如何规划组织数据科学及分析项目?文章插图
图源:unsplash
执行一个数据科学/分析项目从来不是一件容易的事情 。 一个成功而全面的分析项目远远不止是编码 , 它还涉及复杂的设计和大量的沟通 。

远不止编码:如何规划组织数据科学及分析项目?文章插图
什么是分析项目的生命周期?要完成一个数据科学/分析项目 , 你需要经历五个主要阶段 , 从了解问题和设计项目 , 到收集数据、进行分析、展示结果 , 记录和自我反思 。
远不止编码:如何规划组织数据科学及分析项目?文章插图
笔者强烈地感受到 , 运行一个分析项目和建造一座房子非常相似 。 首先 , 建筑师满足其客户 , 了解需求并提出一个可行的蓝图(理解和规划) 。 然后需要收集建筑材料 , 如水泥、钢材、砖块等 。 你必须了解建筑材料的特点 , 并选择合适的建筑材料 。 否则 , 房子可能会很容易倒塌 。
这就像一个数据收集过程 , 你必须做一些EDA或特性工程来理解数据 , 并找到正确的数据来解决问题 , 否则可能无法从分析中获得可靠具体的结果 。
有了建筑材料和蓝图 , 就可以开始建造房子了(运行分析) 。 施工结束后 , 要进行现场检查和质量检查 , 以确保安全 。 同样 , 我们需要记录分析项目的方法、结论和局限性 。
理解和规划
如果有人问我整个周期中最关键的阶段是什么 , 我会毫不犹豫地说理解和规划 , 因为数据科学和分析的主要目的不是用花哨的技术创建一个项目 , 而是解决实际问题 。
因此 , 分析项目的成功在很大程度上取决于理解程度、对问题的定义以及将业务问题转化为分析问题的程度 。 从这个角度来看 , 花时间考虑分析项目更广泛的背景总是值得的 。
提出问题
【远不止编码:如何规划组织数据科学及分析项目?】通常一个分析项目从与合伙人的会议开始 , 你会与商业伙伴见面 。 他们将提供一些背景 , 并简要介绍需求 , 提出明智的问题能让你更好地理解客户的痛点和需求 。
远不止编码:如何规划组织数据科学及分析项目?文章插图
分析计划
在深入分析之前 , 先制定一个分析计划 , 并安排另一个后续会议来回顾问题并强化预期 。 这个计划将提供一个高层次的计划概览 , 给出下一个步骤的清晰蓝图 , 并从业务方面指出技术行动和广阔蓝图之间的联系 。 以下是我分析计划中的一些关键元素:
远不止编码:如何规划组织数据科学及分析项目?文章插图
不要让数据科学和技术变得晦涩难懂 。 试着用通俗的语言对这些方法进行简要描述 , 概述用例和场景 , 总结其优势和局限性 。 避免使用复杂的公式或函数 , 而是专注于该方法如何帮助解决问题 。
完成一个分析项目可能需要几周时间 , 有时甚至更久 。 一个项目所花费的时间越长 , 某些变数对工作造成不利影响的可能性就越大 。 因此 , 项目开始之前 , 第一件事是分解完成项目必须要做的所有步骤 。 然后根据所需的大致时间来完成这些任务 , 并记录每个重大突破 。
远不止编码:如何规划组织数据科学及分析项目?文章插图
建议在项目的中间设置一些签入点 , 以便与涉众交流并获得他们的反馈 , 这样就可以进行及时的调整 , 而不只是做一个最后的演示 。
远不止编码:如何规划组织数据科学及分析项目?文章插图
远不止编码:如何规划组织数据科学及分析项目?文章插图
如何组织项目并跟踪进度利用项目管理工具
当你在做一个复杂的分析项目 , 且需要与多个团队(如工程、产品和业务等)协作时 , 一个简单的待办事项列表或基于excel的跟踪器就无法满足需求了 。
你可以利用专门的项目管理工具和软件 。 如果你用谷歌和简单的搜索项目管理工具会发现很多 , 比如Asana、Trello、JIRA、Monday.com等等 。 你可以根据团队规模和喜欢的工作方式找到合适的工具 。
这个概念征服了我 , 因为它是一个集多个工作应用于一身的多功能工作区 。 为了不同的目的而拥有多种工具并不可取 , 所以可以想象 , “多功能”是最有效的营销信息 。 对我来说 , 在一个地方做计划、跟踪、知识共享和写博客是一个很好的选择 , 它还提供了一些模板来帮助制定旅行计划以及跟踪求职进度 。