• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

爬取B站18000条《黑神话:悟空》实机演示弹幕,做成词云

python 搞java代码 3年前 (2022-05-21) 22次浏览 已收录 0个评论

前言

从不畏惧死亡,只是不忍世道沦丧。 哪怕前途多尸骨,身后无退路—— 这个世界,总有勇敢的生命,再次踏上取经之途。 由游戏科学开发的西游题材单机·动作·角色扮演游戏《黑神话:悟空》今日正式公布长达13分钟的实机演示视频!本视频内容全部基于实际操作录制,将最真实的游戏体验一刀不剪地呈现给玩家。 白骨之后,重走西游。 那群最想做西游的人,真的回来了。 更多信息可关注我们的微博@黑神话之悟空 或前往官网>>heishenhua.com

最近一部黑神话悟空的游戏刷遍网络,从技术而言,普遍认为可以与世界游戏公司相匹敌,又普遍把这部游戏跟中国文化相关联,认为这是向全世界宣扬中国文化的一部作品,8月20日,国产单机新作《黑神话:悟空》公布了13分钟实机演示 ,画质、音效、剧情惊艳四座,被网友形容“国产3A大作”。

知识点:

  • 爬虫基本流程
  • 正则
  • requests

开发环境:

  • Python 3.6
  • Pycharm

爬虫部分代码

导入工具

<span style="color: #0000ff">import</span><span style="color: #000000"> requests
</span><span style="color: #0000ff">import</span><span style="color: #000000"> parsel
</span><span style="color: #0000ff">import</span><span style="color: #000000"> csv
</span><span style="color: #0000ff">import</span> time
www#gaodaima.com来源gaodai.ma#com搞##代!^码网搞代码

 

请求网页,爬取弹幕

url = <span style="color: #800000">"</span><span style="color: #800000">https://api.bilibili.com/x/v2/dm/history?type=1&oid=226204073&date=2020-08-{}</span><span style="color: #800000">"</span><span style="color: #000000">.format(page)
    headers </span>=<span style="color: #000000"> {
        </span><span style="color: #800000">"</span><span style="color: #800000">user-agent</span><span style="color: #800000">"</span>: <span style="color: #800000">"</span><span style="color: #800000">Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36</span><span style="color: #800000">"</span><span style="color: #000000">,
        </span><span style="color: #800000">"</span><span style="color: #800000">cookie</span><span style="color: #800000">"</span>: <span style="color: #800000">"</span><span style="color: #800000">_uuid=50D22ECF-208D-9409-DEA1-0B3EA3F74AB793744infoc; buvid3=A0FE83C2-5981-40DC-B0E2-C74A37227ECF155818infoc; CURRENT_FNVAL=16; rpdid=|(umuummlkY~0J"ulm|ullmll; sid=kr4i59d5; DedeUserID=65901796; DedeUserID__ckMd5=90847fa74c846032; SESSDATA=896f66c1%2C1606454910%2Ceacc7*51; bili_jct=2768c9f3a50e5333de1422cd66782350; LIVE_BUVID=AUTO3215909029132687; blackside_state=1; bsource=search_baidu; bp_video_offset_65901796=429260996026495399; bp_t_offset_65901796=429524591059675137; _dfcaptcha=0543580ac4738e5ca1bdae06da0ee65b; PVID=6</span><span style="color: #800000">"</span><span style="color: #000000">
    }
    response </span>= requests.get(url=url, headers=<span style="color: #000000">headers)
    response.encoding </span>=<span style="color: #000000"> response.apparent_encoding
    selector </span>=<span style="color: #000000"> parsel.Selector(response.text)
    data </span>= selector.css(<span style="color: #800000">"</span><span style="color: #800000">d::text</span><span style="color: #800000">"</span><span style="color: #000000">).getall()
    </span><span style="color: #0000ff">for</span> i <span style="color: #0000ff">in</span><span style="color: #000000"> data:
        </span><span style="color: #0000ff">print</span><span style="color: #000000">(i)
        with open(</span><span style="color: #800000">"</span><span style="color: #800000">B站弹幕.csv</span><span style="color: #800000">"</span>, mode=<span style="color: #800000">"</span><span style="color: #800000">a</span><span style="color: #800000">"</span>, newline=<span style="color: #800000">""</span>, encoding=<span style="color: #800000">"</span><span style="color: #800000">utf-8-sig</span><span style="color: #800000">"</span><span style="color: #000000">) as f:
            writer </span>=<span style="color: #000000"> csv.writer(f)
            links </span>=<span style="color: #000000"> []
            links.append(i)
            writer.writerow(links)</span>

 

运行代码,结果如下图

 

词云图代码

入词云制作库wordcloud和中文分词库jieba

<span style="color: #0000ff">import</span><span style="color: #000000"> jieba
</span><span style="color: #0000ff">import</span> wordcloud

 

导入imageio库中的imread函数,并用这个函数读取本地图片,作为词云形状图片

<span style="color: #0000ff">import</span><span style="color: #000000"> imageio
py </span>= imageio.imread(r<span style="color: #800000">"</span><span style="color: #800000">拳头.png</span><span style="color: #800000">"</span><span style="color: #000000">)
w </span>= wordcloud.WordCloud(width=1000<span style="color: #000000">,
                        height</span>=700<span style="color: #000000">,
                        background_color</span>=<span style="color: #800000">"</span><span style="color: #800000">white</span><span style="color: #800000">"</span><span style="color: #000000">,
                        font_path</span>=<span style="color: #800000">"</span><span style="color: #800000">msyh.ttc</span><span style="color: #800000">"</span><span style="color: #000000">,
                        mask</span>=<span style="color: #000000">py,
                        scale</span>=15<span style="color: #000000">,
                        stopwords</span>={<span style="color: #800000">"</span> <span style="color: #800000">"</span><span style="color: #000000">},
                      )<br></span>
<code><span class="hljs-comment"># 想要完整源码的同学可以关注我的公众号:松鼠爱吃饼干<br><span class="hljs-comment"># 回复“悟空”即可免费获取</span></span></code>

 

将词云图片导出到当前文件夹

w.to_file(<span style="color: #800000">"</span><span style="color: #800000">悟空.png</span><span style="color: #800000">"</span>)

 

最终效果图

原图

 

 
 

搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:爬取B站18000条《黑神话:悟空》实机演示弹幕,做成词云

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址