只有我手动更新并重新运行了所有数据,使数据集翻了一番。没有 API。我的大脑是瑞士奶酪。 我们想了解新编写的原创内容在一段时间内的表现如何,以及哪些因素可能影响了这种表现。 老兄,为什么要这么难? “为什么不从搜索结果中提取数百(或数千!)个数据点来扩大您的数据集?”,您可能会想。已经成功完成了好几次了! 相信我,当我对着键盘哭泣时,我也在想同样的事情。 答案很简单:我想做一些不同于大规模综合研究的事情。我希望对尽可能多的潜在影响变量进行一定程度的控制。 通过使用我们自己的数据,该研究受益于: 所有内容的相同根域权限。 类似的个人 URL 链接配置文件(稍后有人会笑)。 已知原始发布日期,无需重新优化或修补。 每个博客的已知原始关键字目标(而不是猜测)。
已知且一致的内容深度/质量分数 (MarketMuse)。 用于针对每个博客的特定关键字的类似内容写作技术。 您永远不会消除将相关性误解为因果关系 号码表 的可能性。但是控制一些变量会有所帮助。 正如兰德在周五的白板上所说,“相关性并不意味着因果关系(但它肯定是一个暗示)。” 警告: 我们在控制中获得的东西,我们失去了样本量。96 个样本量远不如一万或十万有用。因此,在考虑您认为最有可能为真的排名因素时,请仔细查看数据并谨慎行事。 此资源可以帮助衡量您应该对每个 Pearson 相关值的置信度。一般来说,关系越强,需要对结果有信心的样本量就越小。
那么你到底在这里做了什么? 我们已经对可能影响新创建内容的有机性能的因素产生了暗示。不多也不少。但它们确实是有趣的提示,也许值得进一步讨论或研究。 你没有做什么? 我们还没有发表关于谷歌算法的全面概括。这篇文章不应被视为 Google 算法的权威指南,也不应假设您的网站将展示相同的相关性。 那么我应该如何处理这些数据呢? 阅读本文的最佳方式是观察我们观察到的与数据的潜在相关性,并考虑这些相关性可能或可能不适用于您的内容和策略的可能性。 我希望这项研究采用一种新的方法来研究单个 URL,并激发建设性的辩论和对话。