抖音刷赞 --抖音推广
时间:2023-3-18 14:41
热度:27°
Instagram 很棒,所以让我们从中提取一些数据!在本文中,我将向您展示如何拉取特定用户可能拥有的关注者数量。在后面的教程中,我还将向您展示如何从 Instagram 中间提取其他数据点。让我们开始吧!
安装Selenium
安装 Selenium,进入您的终端/命令提示符并输入
pipinstall selenium
使用selenium
现在我们已经设置了 Python 环境,让我们打开一个空白的 Python 脚本。让我们导入您希望从上一段中预安装的 Selenium 包(只需 pip install selenium)。安装后,导入以下包:
IMPORT THESE PACKAGESimportseleniumfromseleniumimportwebdriverOPTIONAL PACKAGE, BUY MAYBE NEEDEDfromwebdriver_manager.chromeimportChromeDriverManager
在 Selenium 中,我们需要定义我们的 Web 浏览器,所以让我们使用以下代码行来实现:
THIS 初始化驱动程序(又名网络浏览器)driver= webdriver.Chrome(ChromeDriverManager().install())
我建议运行您刚刚输入的所有代码,看看是否打开了一个空白的谷歌浏览器窗口,如果是这样,说明一切顺利!
接下来,我们要获取什么 Instagram 账户的 URL,在本例中,我们将使用 Kim Kardashian。一旦我们知道要使用哪个 Instagram URL,让我们回到您的 Python 脚本复制并粘贴以下代码:
THIS 相当多地告诉 Web 浏览器转到driver.get的网站(在此处复制并粘贴您的 URL)
代码应如下所示:
这个相当多地告诉网络浏览器哪个网站去driver.get(https://www.instagram.com/xxxx/)
接下来,我们要从 Web 浏览器获取评论的 HTML 属性。首先,研究如何从 Web 浏览器启用开发人员的设置并启用这些设置。
接下来,我们要右键单击实际评论数(如下所示),然后单击检查,您应该会弹出如下所示:
接下来,我们要点击与这些关注者匹配的号码,右键单击>复制>复制完整的XPath,
复制并粘贴此代码并将其粘贴到您的 Python 脚本中:
此文本部分 | 这部分将包含PRETTY 存储 | 的元素 我们希望从网站中获取.TEXT 将是我们想要的WEBSITE 数据| 将信息保存为文本文件IN 此变量 |FOLLOWERS = driver.find_element_by_xpath(POST YOUR XPATH HERE).textPRINTS OUT THE DATA PULLED from ABOVEprint(FOLLOWERS)
代码应如下所示:
此文本部分 | 这部分将包含PRETTY 存储 | 的元素 我们希望从网站中获取.TEXT 将是我们想要的WEBSITE 数据| 将信息保存为文本文件IN 此变量 |FOLLOWERS = driver.find_element_by_xpath(/html/body/div[1]/section/main/div/header/section/ul/li[2]/a/span).textPRINTS OUT THE DATA PULLED FROM ABOVEprint(FOLLOWERS)
继续运行这段代码,你应该会看到一个 Google Chrome 窗口打开,然后 Python 控制台应该在 Python 控制台中输出关注者的数量: