京公网安备 11010802034615号
经营许可证编号:京B2-20210330
HamptonCreek是一家专门生产植物鸡蛋食品的创业公司,它最有名的产品是“Just Mayo”,这家公司在本周刚刚进驻Dollar Tree开设专卖店,在接下来的几个月中,它还会将公司位于旧金山市中心的总部扩建成占地9万平方英尺的办公场所。不过它最大的动作还是挖走了Google的高级数据分析师丹·西格蒙德(Dan Zigmond)。HamptonCreek这样做得原因是什么呢?是要颠覆整个食品制造业。
西格蒙德在过去八年的时间里一直都在处理YouTube和Google Maps 出现的数据难题。他现在的新任务是为Hampton Creek建立全世界最大的植物数据库。这个数据库有可能会改变我们每天早上放进嘴里吃的东西,只是我们不会觉察到有什么不同而已。
可能你现在还看不出来,一位任职于蛋黄酱公司的前任Google数据科学家可以怎样改变标准美国饮食(SAD),不过根据Hampton Creek的CEO乔什·蒂特里克(Josh Tetrick)的说法,西格蒙德正是最合适的人员。“丹拥有令人难以置信的大脑,他能够整理大量的数据,并从中找出数据之间的真正联系。”他所说的“真 正的联系”指的是利用现有的数据库找出能够真正改善地球的植物。
我们已经吃了太多垃圾食品了,所以我们需要吃更多的植物!USDA最新发表的一份调查表明,我们购入了太多的红肉、细粮和不健康的脂肪。
虽然有某些研究指出美国的肉类消费正在下降,但是全世界范围的整体肉类消费正在上升。从某种程度上来说这是个好消息,因为这意味着一些曾经贫穷落后 的国家现在可以买得起更贵的食物了。尽管这是世界经济环境改善的信号,但是这对于我们的环境和身体健康来说就不是一件好事了。而且那些动物工业区的名声也 不太好。不过我们暂时先放下这些虐待动物的问题,先来看看下面的一些数字,我们要消耗5到6磅的玉米,52加仑的水和超过1,000 BTU的石油才能得到一块四分之一磅的牛肉饼。
另外,过量摄入玉米和大豆产品也导致美国人的体重大幅上升。这可能是因为购买精细或者加工过的食物的价格要比健康有机蔬果便宜得多。自从大萧条以 来,美国政府一直都根据农业法案向种植某些作物(例如玉米和大豆)的农民提供津贴。这份法案对薯片和糖果的产量提供了很大的支持,但是苹果就没有享受到这 种待遇了。
肥胖症与低收入水平的相关性也是一个无可否认的事实。超市里面能买到最便宜的食品通常都有较高的卡路里含量和较低的营养价值。这些食品大部分都是来 自农业法案所扶持的玉米和大豆。以上的原因导致了每三个美国成人当中就有一人患有肥胖症。这意味着现在美国有超过1亿的人口正在面临更高的健康风险,比如 更容易患上糖尿病和心脏病。另外,截至2008年,我们每年的医疗支出已经超过了1,470亿美元!
然而,要建立全世界最大的植物数据库来解决以上的问题可不是一件简单的事情。现在世界上有超过870万种已知的植物,更不要提每种植物之下还有多种不同的分类了。
全世界最大的植物数据库可以为世界饥饿问题做些什么
根据联合国粮食及农业组织(FAO)的估计,每晚有超过10亿人都是在饥饿的状态下入睡的。我们为食用的动物提供的粮食都比提供给这些人的多。我们应该将更多的土地用于种植粮食,而不是养殖动物,这种做法可以大幅降低发展中国家购买主食的负担。
工厂化农业经营造成了大型工业化农场的垄断地位,这样会导致大规模的浪费,我们的土壤也会被磷酸甘油之类的除草剂污染,工人的收入被拉低,另外现在 很多普通的病原体都对抗生素产生了抗药性,有很大一部分的原因都是来源于农场的工业化经营。Hampton Creek的想法是建立一个数据库,让其他的公司可以从中获取世界上各种植物的信息,然后利用这些信息来鼓励农民种植一些对地球有好处的新经济作物(不仅 仅是大豆和玉米)。这样反过来也能帮助农民更好地养家糊口,提供更加健康、性价比更高的食物,同时也能带动小型农场的发展。
Hampton Creek的调研团队现在已经记录了13种植物当中的4,000棵不同的植物,希望找出比HamptonCreek现有产品拥有更好地稳定性和口感,而且 价格更低的植物特性。蒂特里克做出了这样的比喻,“我们现在不是在搅拌鸡蛋,而是将植物捣碎,找出我们需要的特性。”
Hampton Creek最出名的产品是蛋黄酱,不过它也有卖不含鸡蛋的曲奇饼。他们很快就会推出一种外观和味道都跟鸡蛋一样的豆制品。蒂特里克说如果拥有世界上最大的 植物数据库的话,他们将会推出更多不含鸡蛋的产品。他表示有一种植物现在还没有投入市场,但是它可以降低糖果的含糖量,同时还能保持糖果本来的味道。
这家公司的目标是向大众提供价格合理,同时能够改善地球的食品。“这就是我们最近进驻Dollar Tree的原因。”蒂特里克说道,“比如像我爸爸这样的人就应该买得起蛋黄酱,不用担心它的价格和是否健康。对于普通人来说,食物应该变得更加健康和便 宜,不然它们就没有任何意义了。”
西格蒙德如果建立出全世界最大的植物数据库,Hampton Creek就可以开始研究那些植物拥有他们所需的特性,可以做出更健康、更便宜,而且对动物和环境的影响更低的食品。
蒂特里克深入的解释了他们发现某些类型的加拿大黄豆拥有合适的分子质量,这就意味着这些黄豆拥有合适的稳定性,可以用于制作Hampton想要的产品。但是从目前来看,要找到更多这样的植物特性无异于大海捞针。仅仅是加拿大黄豆就有超过2,000个变种。
根据蒂特里克的说法,如果了解了这方面的知识之后,他们就可以做出更便宜、更安全、更健康的产品。而且这些信息也是一些大型食品厂商愿意花钱购买 的。虽然蒂特里克不愿意透露具体的厂商名字,但是他说Hampton Creek现在已经跟几家知名的食品品牌商讨数据库授权的事宜。
“如果现在有人要用十亿美元买下Hampton Creek,我们全公司上下都会毫不犹豫地拒绝。”蒂特里克说道。这家公司现在已经获得了由Bill Gates Foundation和Google Ventures等投资人提供的3,000万美元资金,这是一家盈利性的公司,目前处于盈利状态。他们的“Just Mayo”产品在全国的Whole Foods、Safeway、Costco和Dollar Tree等商店有售。
Dollar Tree这家商店对于蒂特里克个人来说有着最重要的意义,因为这是一家面向中等收入的美国人的商店,也是他爸爸会走进去买东西的商店。这也是他愿意将他们 的信息卖给一些大型食品厂商的原因。他想要这些产品变得随处可见,能够让人们真正吃上更好地食物,无需再站在收银台前在价格和健康之间作出选择。“我真的 很想做一些能够改变世界的事情。”这对于他和西格蒙德来说是真是一份量身定做的工作。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29