Como usar o comando wget no Linux
-
Verifique se o
wget
está instalado ou não -
Sintaxe do comando
wget
-
Download de arquivo com o
wget
-
Salvar o arquivo baixado utilizando o
wget
com um nome de arquivo personalizado -
Salva o arquivo baixado utilizando o
wget
em um diretório específico -
Especifique a velocidade de download utilizando o
wget
-
Retomar o download utilizando o
wget
-
Download de arquivos em background utilizando a opção
wget
-
Alterar o
wget
Usuário-Agente dowget
-
Download de múltiplos arquivos simultaneamente utilizando o
wget
-
Download de arquivos utilizando o comando
wget
via FTP -
Criar uma cópia do site utilizando
wget
- Pular a verificação de certificado durante a utilização do Wget
Podemos utilizar o comando wget
no Linux para baixar arquivos da Internet utilizando os protocolos HTTP, HTTPS e FTP com várias opções como baixar vários arquivos de uma só vez, baixar em segundo plano, limitar a largura de banda, e muito mais.
Verifique se o wget
está instalado ou não
Podemos verificar se o wget
está instalado ou não em nosso sistema simplesmente inserindo o comando wget
em nosso terminal.
Se o wget
estiver instalado em nosso sistema, obtemos uma saída como:
wget: missing URL
Usage: wget [OPTION]... [URL]...
Try 'wget --help' for more options.
Se o wget
não estiver instalado em nosso sistema, obtemos uma saída como:
Command 'wget' not found, but can be installed with:
sudo snap install wget
Se wget
não estiver instalado em nosso sistema, podemos instalá-lo utilizando os seguintes comandos:
Instalar wget
para Ubuntu e Debian
sudo apt install wget
Instalar wget
para CentOS e Fedora
sudo yum install wget
Sintaxe do comando wget
wget [options] [url]
options
são várias opções disponíveis para personalizar o processo de download e url
refere-se ao URL
de onde o arquivo precisa ser baixado ou sincronizado.
Download de arquivo com o wget
Para baixar um arquivo utilizando o comando wget
, basta especificar a URL do reporte do arquivo após o wget
.
wget https://bloximages.newyork1.vip.townnews.com/redandblack.com/content/tncms/assets/v3/editorial/4/59/45940eb2-5403-11e9-a843-db0e4491cc90/5ca13d8453042.image.jpg
Resultado:
--2020-09-28 19:29:15-- https://bloximages.newyork1.vip.townnews.com/redandblack.com/content/tncms/assets/v3/editorial/4/59/45940eb2-5403-11e9-a843-db0e4491cc90/5ca13d8453042.image.jpg
Resolving bloximages.newyork1.vip.townnews.com (bloximages.newyork1.vip.townnews.com)... 104.18.130.43, 104.18.131.43
Connecting to bloximages.newyork1.vip.townnews.com (bloximages.newyork1.vip.townnews.com)|104.18.130.43|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 33241 (32K) [image/jpeg]
Saving to: '5ca13d8453042.image.jpg'
5ca13d8453042.image 100%[===================>] 32.46K --.-KB/s in 0.003s
2020-09-28 19:29:15 (11.1 MB/s) - '5ca13d8453042.image.jpg' saved [33241/33241]
Ele baixa o arquivo de imagem na URL indicada e depois salva o arquivo baixado em nosso diretório de trabalho atual.
O comando primeiro resolve o endereço IP da URL e depois inicia o download. Também podemos ver a barra de progresso do download no terminal.
Se não quisermos ver nenhuma saída no terminal, podemos utilizar a opção -q
com o comando wget
.
Salvar o arquivo baixado utilizando o wget
com um nome de arquivo personalizado
Por padrão, o nome do arquivo baixado é o mesmo que estava na web. Se quisermos salvar o arquivo com um nome de arquivo diferente, podemos especificar o nome do arquivo após a bandeira -O
.
wget -O linux.jpg https://bloximages.newyork1.vip.townnews.com/redandblack.com/content/tncms/assets/v3/editorial/4/59/45940eb2-5403-11e9-a843-db0e4491cc90/5ca13d8453042.image.jpg
Ele salva o arquivo baixado em nosso diretório de trabalho atual com o nome do arquivo linux.jpg
.
Salva o arquivo baixado utilizando o wget
em um diretório específico
Por padrão, todos os arquivos baixados são salvos no diretório de trabalho atual. Para salvar os arquivos baixados em um diretório específico, usamos a opção -P
seguida do local do diretório onde o arquivo baixado precisa ser salvo.
wget -P Downloads/Linux_Images https://bloximages.newyork1.vip.townnews.com/redandblack.com/content/tncms/assets/v3/editorial/4/59/45940eb2-5403-11e9-a843-db0e4491cc90/5ca13d8453042.image.jpg
Ela salva a imagem baixada no diretório Linux_Images
dentro do diretório Downloads
.
Especifique a velocidade de download utilizando o wget
Se não quisermos utilizar toda a largura de banda disponível para o download de arquivos utilizando wget
, podemos utilizar a opção --limit-rate
para restringir a taxa de download dos arquivos.
wget -P --limit-rate=5m https://bloximages.newyork1.vip.townnews.com/redandblack.com/content/tncms/assets/v3/editorial/4/59/45940eb2-5403-11e9-a843-db0e4491cc90/5ca13d8453042.image.jpg
Ela limita a taxa de download a 5 MB.
Retomar o download utilizando o wget
Se nossa conexão à Internet desaparece de repente em meio ao download de um arquivo grande, baixar o arquivo do início novamente seria uma tarefa tediosa. Em tais casos, podemos retomar o download utilizando a opção -c
.
wget -c https://bloximages.newyork1.vip.townnews.com/redandblack.com/content/tncms/assets/v3/editorial/4/59/45940eb2-5403-11e9-a843-db0e4491cc90/5ca13d8453042.image.jpg
Em alguns casos, o servidor pode não suportar a retomada dos downloads e, em tal caso, o download começará desde o início.
Download de arquivos em background utilizando a opção wget
Para baixar arquivos em segundo plano utilizando wget
, adicionamos a opção -b
ao comando.
wget -b https://releases.ubuntu.com/20.04/ubuntu-20.04.1-desktop-amd64.iso
Ele irá baixar o arquivo de imagem Ubuntu 20.04 em segundo plano.
Para ver o status de download do arquivo, utilizamos o seguinte comando:
tail -f wget-log
Alterar o wget
Usuário-Agente do wget
Em alguns casos, o servidor pode bloquear o agente usuário do wget. Nesses casos, podemos emular um navegador diferente utilizando a opção -U
.
get --user-agent="Mozilla/5.0 (X11; Linux x86_64; rv:68.0) Gecko/20100101 Firefox/68.0" <url>
Neste caso, o Mozilla 68 solicitará o arquivo a partir da opção <url>
.
Download de múltiplos arquivos simultaneamente utilizando o wget
Para baixar vários arquivos utilizando o wget, fazemos um .txt
que lista URLs para cada arquivo a ser baixado em uma linha separada. Utilizamos então o comando wget
com a opção -i
seguido do caminho do arquivo contendo URLs.
wget -i files.txt
Isto irá baixar todos os arquivos das URLs especificadas no arquivo files.txt
.
Download de arquivos utilizando o comando wget
via FTP
Para baixar arquivos utilizando o comando wget via FTP, especificamos o nome de usuário utilizando a opção --ftp-user
e senha utilizando a opção --ftp-password
.
wget --ftp-user=username --ftp-password=password <url>
Ele baixa o arquivo da URL especificada utilizando o protocolo FTP
.
Criar uma cópia do site utilizando wget
Para criar uma cópia de um site utilizando wget
, utilizamos a opção -m
seguida do URL cuja cópia deve ser feita.
wget -m https://abc.com
Isto criará uma cópia do abc.com
baixando todos os links internos e arquivos estáticos necessários para renderizar o site.
Se desejarmos executar o website baixado, também precisamos adicionar as opções -k
e -p
.
wget -m -k -p https://abc.com
Pular a verificação de certificado durante a utilização do Wget
Às vezes, precisamos baixar um arquivo do host sem um certificado SSL válido usando o protocolo HTTPS. Nesses casos, utilizamos a opção --no-check-certificate
para pular as verificações do certificado.
wget --no-check-certificate <url>
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn