为大家分享一个视频爬虫工具,you-get 可以很便捷的下载视频、音频网站中的文件。
目前针对windows用户,推荐采用两种方法,一是直接pip安装(python用户推荐),二是下载使用一个批处理工具https://github.com/twlz0ne/you-get_install,一键安装
使用很简单:
打开cmd,或者通过批处理工具提供的终端。
输入:you-get 网址
即可。
例如:
可以看到,他显示了下周格式、大小以及下载进度,下载后的文件会放在启动命令行的目录下,或者你也可以指定目录。
同时对于bilibili等网站,还会自动下载弹幕文件,如下图所示。
下面再分享几个常用的方法:
- 使用 --info 或 -I 来查看网站视频的所有可用质量、格式(如高清、低清、mp4、flv等)
它会返回你一个可用的列表,并且提示用使用什么命令去下载他们。
例如,如果你想用上面 MP4格式、medium质量的视频,则使用 you-get --itg=18[….url….]即可。
- 一般情况下下载使用的是默认格式、质量(最高质量)
如果一个视频有任何封闭字幕/弹幕,他们将会和视频文件一起下载)
- 下载一下别的(如图片、音频)
如果你已经有了确切的url地址,那么跟视频下载方式相同。
否则you-get会爬取web页面,并且尝试去查找是否有你感兴趣的东西——这一功能是一个实验性功能,可以用于以大型图片展示为主的的网站。
- 暂停并恢复下载
暂定:Ctrl+c,会留下一个.download文件保存。下一次下载时,如果你使用相同的参数,会继续上一次的下载。
为了强制重新下载,请使用-force/-f选项。(警告:这样做会覆盖所有现有的文件或具有相同名称的临时文件!)
- 设置下载路径和文件名
下载路径设置: --output-dir 或 -o
文件名设置: --output-filename 或 -0
例如:
$ you-get -o ~/Videos -O zoo.webm 'https://www.youtube.com/watch?v=jNQXAC9IVRw
- 代理设置
例如:
$ you-get -x 127.0.0.1:8087 'https://www.youtube.com/watch?v=jNQXAC9IVRw
- 观看视频
不是下载视频,而是使用你指定的播放器来观看。
变量: -playe 或 -p 、播放器名(例如下面的vlc)
例如:
$ you-get -p vlc 'https://www.youtube.com/watch?v=jNQXAC9IVRw'
如果你更喜欢在浏览器中观看视频,仅去除广告或评论:
$ you-get -p chromium 'https://www.youtube.com/watch?v=jNQXAC9IVRw'
你也可以在观看的时候顺便下载:
$ you-get -p uget-gtk 'https://www.youtube.com/watch?v=jNQXAC9IVRw'
- 获得一个页面可下载资源列表
使用 --url 或 -u 来得到一个从页面中提取的可下载资源url列表。
可以使用 --json
- 加载cookies
并不是所有视频都可以公开的,很多网站需要会员、注册用户
你可以通过 you-get 的 --cookies 或 -c变量来加载cookies
目前支持两种cookies Mozilla cookies.sqlite and Netscape cookies.txt.