基于数据的决策：使用数据库内机器学习预测未来-数据挖掘决策树id3算法

在短短几年时间里，机器学习(ML)已经成为公司在其业务的几乎每个方面都部署的一项基本技术。ML市场以前是财大气大的大型机构的领地，现在正在迅速开放。每一种业务现在都可以利用ML来减少重复的手工流程，自动化决策，并预测未来的趋势。在任何业务任务的几乎每个阶段，ML都在使流程更智能、更精简、更快速。

近年来，技术进步通过减少获得ML驱动预测所需的时间、技能水平和步骤数量，帮助实现了ML的民主化，并推动了ML的采用。全球ML市场增长如此之快，预计将从2022年的210亿美元扩大到2029年的2090亿美元。声明式ML和AutoML等工具正在帮助企业访问强大的、业务关键型预测分析。将这些方法进一步推进，开源数据库内ML是一种正在获得发展的新技术。它允许企业轻松地向数据提出问题，并使用标准SQL查询快速获得答案。

什么是数据库内 ML？

传统上，构建 ML 模型是一项高技能、漫长、资源密集型的工作。ML 计划的典型时间范围以月为单位。项目花费超过六个月的时间并不罕见，需要大量时间用于从数据库中提取、清理和准备数据。

相比之下，开源数据库内 ML 将分析引入数据库，使企业能够获得您期望从传统的完全自定义 ML 模型中获得的那种见解，但存在一些重要差异。数据库内 ML 可以更快地（几天或几周，而不是几个月）获得这些结果，因为数据永远不需要离开数据库。另一个区别是，数据库内建模是使用常规的、现有的数据库技能（如SQL）完成的，这使得更广泛的IT团队更容易处理它。

虽然这是一个相对较新的领域，但它现在是GitHub明星代言的ML增长最快的部分。事实上，现在所有主要数据库供应商、ML 框架、BI 工具和笔记本都有数据库内 ML 集成。

企业如何使用数据库内 ML？

从人力资源到营销，从销售到生产，每个业务领域的用例都在帮助公司磨练客户体验，改善产品个性化，优化客户生命周期价值，提高员工保留率，更准确地评估风险，并提高工作场所的生产力。

以生产力软件领域的一个例子为例：Rize，一个智能时间跟踪器，使用户在工作中更加富有成效和效率，使用数据库内ML开发了一个强大的功能，以在几周内响应用户反馈。由此产生的功能（由 ML 生成的见解驱动）提高了客户保留率和转化率。它还帮助Rize在竞争激烈的市场中脱颖而出，巩固了其作为真正智能时间跟踪器的地位。

数据库内 ML 重塑行业的速度和规模

虽然其中许多用例使企业受益，无论行业或位置如何，但特定的行业应用程序正在出现，这些应用程序实时提供未来的洞察力，建立成本仅为传统ML算法的一小部分，并开始破坏这些市场中的现有价值链。

金融部门 – 一个快速实施传统ML建模的行业 – 现在正在转向数据库内建模以提高敏捷性。金融服务和金融科技公司正在使用数据库内 ML 来检测欺诈、帮助贷款回收、改善信用评分和批准贷款。因此，他们能够更快地对市场状况做出反应，调整他们提供的服务，甚至开辟新的收入来源。

例如，下一代多户房租支付处理平台 Domuso 使用数据库内 ML 每年节省 500，000 美元。 Domuso 训练并部署了一个数据库内 ML 模型，以准确预测租金是否可能因资金不足而退还。“借助数据库内ML，我们可以更快地实现高级模型，并降低复杂性，”Domuso当时的产品和运营执行副总裁Sameer Nayyar说。“这对我们的业务产生了积极影响。我们看到退款在两个月内减少了 95，000 美元，第一年节省了 500，000 美元。此外，随着新用例的出现，Domuso 现在能够在几周内创建和实施新的 ML 模型，而不是几个月。

零售、快速消费品和食品生产等行业已经迅速实现了数据库内建模的实时预测，帮助他们通过“及时”和特定于位置的优惠来应对市场状况。管理库存、预测特定物品的需求、优化人员配备水平以及预测未来定价只是零售和其他企业如何转向数据库内 ML 算法以应对日常挑战的几个例子。

以Journey Foods为例，这是一个用于食品开发和创新的供应链和食品科学软件平台，它使用数据库内ML来应对不断变化的原料价格的挑战。他们希望利用其包含 22，000 家供应商的 130，000 种食品成分的数据库，在 1 个月、3 个月、6 个月和 12 个月内为客户预测食品成本。由于成分和供应商总是在变化，他们担心绘制这些复杂的“多对多”关系所需的预测分析将非常耗时，并且需要持续的维护和重新培训。Journey Foods 求助于数据库内 ML 来开发其成本预测模型，从而对食品成分进行高精度预测。这也导致运营成本显着降低于他们最初考虑的本土ML模型。

提高业务敏捷性和创新能力

还有更多行业特定的例子，但推动这种快速增长的开源运动的共同因素是速度和规模。数据库内 ML 为任何拥有数据库的企业提供复杂的预测分析。

例如，在最近的开源数据库内ML黑客马拉松Hacktoberfest上，不断增长的数据库内ML程序员社区恰如其分地展示了创新的潜力。在活动过程中，团队提交了20多个新的数据库处理程序，包括与Apache Impala和Solr，PlanetScale和Teradata的连接，以及10多个新的机器学习处理程序，包括PyCaret，Ray Server和Salesforce。

数据库内分析仍处于早期阶段。就像更广泛的AI行业一样，ML细分市场对炒作并不陌生。然而，由于对复杂问题的快速回答不再只是理论上的可能，而是可以在短期内由各种规模和预算的企业实现，数据库内ML值得认真考虑。缩短构建模型所需的时间，并使没有数据科学背景的人能够运行项目，从而大大降低了与预测分析相关的成本。基于数据的决策为企业提供了传统 ML 技术的可行替代方案：快速、大规模地提供完全可定制的预测功能。

免责声明：文章内容来自互联网，本站不对其真实性负责，也不承担任何法律责任，如有侵权等情况，请与本站联系删除。
转载请注明出处：基于数据的决策：使用数据库内机器学习预测未来-数据挖掘决策树id3算法 https://www.yhzz.com.cn/a/9332.html

基于数据的决策：使用数据库内机器学习预测未来-数据挖掘决策树id3算法

什么是数据库内 ML？

企业如何使用数据库内 ML？

数据库内 ML 重塑行业的速度和规模

提高业务敏捷性和创新能力

相关推荐

分享到:

请登录