• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

用bs4爬取标签内的text的问题

php 搞代码 3年前 (2022-01-25) 39次浏览 已收录 0个评论
文章目录[隐藏]
<code class="python">def get_coursename(info):  info = get_content(url)  soup = <strong>)本文来(源gaodai#ma#com搞@@代~&码*网2</strong><pre>搞代gaodaima码

BeautifulSoup(info) all_coursename = soup.find_all(‘h2’, class_=”color-primary-text headline-1-text flex-1″) #print all_coursename f = open(“course_coursename.txt”,”w”) for coursename in all_coursename: detail = soup.h2.get_text() print detail f.write(detail + ‘\n’ ) f.close return all_coursename

以上是我的代码,使用soup.find_all()函数后在coursera得到64个标签段,但是使用递归对象和写入文件后,controlb后得到了64个第一个课程的名字,如下,求大神解答

Buddhism and Modern Psychology
Buddhism and Modern Psychology
.
.
.
.

回复内容:

<code class="python">def get_coursename(info):  info = get_content(url)  soup = BeautifulSoup(info)    all_coursename = soup.find_all('h2', class_="color-primary-text headline-1-text flex-1")    #print all_coursename    f = open("course_coursename.txt","w")  for coursename in all_coursename:      detail = soup.h2.get_text()            print detail      f.write(detail + '\n' )      f.close  return all_coursename</code>

以上是我的代码,使用soup.find_all()函数后在coursera得到64个标签段,但是使用递归对象和写入文件后,controlb后得到了64个第一个课程的名字,如下,求大神解答

Buddhism and Modern Psychology
Buddhism and Modern Psychology
.
.
.
.

你的for循环里应该使用循环变量coursename而不是soup

代码不全啊,我发现几个小问题。你的get_coursename()的参数 info 是不是多余了?另外你在get_coursename()里面直接调用get_content(url)这不是无中生有吗?


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:用bs4爬取标签内的text的问题
喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址