YouTube涨粉丝 --youtube涨播放量网站
概要共1191字,预计今年自学时数6两分钟
图源:unsplash
程序语言是表述文档中搜寻商业模式的转义字符串。re.findall()是Python中最基本上的程序语言表达式众所周知,抽取数组表达式的结尾。责任编辑将用那个表达式说你,YouTube音频副标题与播映量间的亲密关系。
上面已经开始吧!
具体来说,引入python程序语言组件re:
importre
假定有下列数组:
test_string1=Python is Amazing!
可将表达式r^\w+与数组通通传达至re.findall,这将回到输出数组的结尾:
regex_1 =re.findall(r"^\w+",test_string1)
print(regex_1)
在表达式r^\w+中,字符^对应数组结尾,而\w+查找数组中的字母数字字符。
如果去掉^,会得到:
regex_1 =re.findall(r"\w+",test_string1)
print(regex_1)
试抽取另一个数组示例的结尾:
test_string2=Java is Amazing!
图源:unsplash
现在,应用re.findall()查找该数组的第一个单词:
regex_2 =re.findall(r"^\w+",test_string2)
print(regex_2)
接下来,考虑一个更实际的场景。假定有一个YouTube音频副标题列表和相应的YouTube观看次数。我们可能对分析音频副标题的第一个单词和相应音频观看次数间的亲密关系感兴趣。考虑下列副标题/观看次数元组列表:
youtube_titles= [("How to Tell if Were Beating COVID-19",2200000), ("ExtremeCloset Clean Out",326000), ("This is $1,000,000 inFood",8800000), ("How To Tell If Someone Truly Loves You ",2800000), ("How to Tell Real Gold from Fake",2300000),("Extreme living room transformation ",25000)]
可以通过下列方式找到每个副标题的第一个单词:
fortitlein youtube_titles:
print(re.findall(r"^\w+",title[0])[0])
可以将这些值添加到列表中:
first_words= []fortitleinyoutube_titles:
first_words.append(re.findall(r"^\w+",title[0])[0])
print(first_words)
还可以将观看次数附加到列表中:
first_words= []
views = []fortitleinyoutube_titles:
first_words.append(re.findall(r"^\w+",title[0])[0])
views.append(title[1])
然后,可以创建音频首字值和音频观看次数的数据框:
importpandasaspd
df = pd.DataFrame({first_words: first_words,views:views})print(df)
之后可以对每个副标题首词进行分组,并计算每个副标题首词的平均观看次数:
df =df.groupby(first_words)[views].mean()print(df)
按降序方式对这些值进行排序:
df =df.groupby(first_words)[views].mean().sort_values(ascending =False)print(df)
假定这些结果来自一个足够大的数据集(比如有数千个副标题和观看次数),这种类型的分析可以帮助我们选择最佳的YouTube音频副标题。
图源:unsplash
责任编辑讨论了如何使用python程序语言组件中的re.findall()表达式。为抽取每个数组的第一个单词,笔者将该表达式应用于两个简单的数组。然后,考虑了一个实际用例,使用该表达式抽取YouTube音频副标题的第一个单词,并计算第一个单词对应的平均观看次数。
10万+的副标题,或许就是这么来的。
留言点赞关注
我们一起分享AI自学与发展的干货