选择用文本编辑器打开修改config.py文件 4. 更新下面突出显示的三个区域: CLIENT_ID:来自 OAuth 2.0 客户端 ID 设置过程 CLIENT_SECRET:来自 OAuth 2.0 客户端 ID 设置过程 GOOGLE_CREDENTIALS:与您的 CLIENT_ID 和 CLIENT_SECRET 对应的电子邮件 更新 CLIENT_ID(来自 OAuth 2.0 客户端 ID 设置流程)、CLIENT_SECRET(来自 OAuth 2.0 客户端 ID 设置流程)以及与您的 CLIENT_ID 和 CLIENT_SECRET 相对应的 GOOGLE_CREDENTIALS 电子邮件 5. 更新后保存文件! 恭喜,无聊的部分已经结束了。
现在您可以开始使用 Google Colab 文件了! 运行您的第一个分析 运行你的第一 哥伦比亚电话数据 次分析可能会有点令人生畏,但坚持下去它很快就会变得容易。 下面,我们提供了有关所需输入变量的详细信息,以及运行脚本和分析结果数据集时需要注意的事项。 在我们介绍完这些项目之后,还会提供一些示例项目和视频演示,展示如何利用这些数据集向客户交付成果。 设置输入变量 使用“xpath_selector”变量进行 XPath 提取 您是否曾经想知道每个导致网页点击和展示的查询,这些查询并不包含在您的 <title> 或 <h1> 标签中?这个参数可以让您做到这一点。
虽然这是可选的,但我们强烈建议您使用此功能,并且我们认为它可以“增强”分析能力。只需使用 Xpath 定义站点部分,脚本就会完成剩下的工作。 在上面的视频中,您将看到有关如何创建特定于站点的提取的示例。此外,下面是一些通用提取,它们应该适用于网络上的几乎所有站点: '//title' # 标识 <title> 标签 '//h1' # 标识 <h1> 标签 '//h2' # 标识 <h2> 标签 站点特定:如何仅抓取主要内容(MC)? 链接 Xpath – 在 Xpath 之间添加“|” '//# 一次运行即可获得 一次运行即可获得 <h1>、<h2> 和 <h3> 标签 其他变量 以。