Po třech a půl letech vývoje vydání první stabilní verze projektu "GNU Wget2 2.0", který je vyvíjen jako zcela přepracovaná verze programu pro automatizaci rekurzivního načítání obsahu „GNU Wget“.
GNU Wget2 je navržen a přepsán od nuly, a je pozoruhodné odstraněním základních funkcí webového klienta z knihovny libwget, které lze použít v samostatných aplikacích.
O Wget2
Namísto postupného přepracovávání stávající základny kódu rozhodl se předělat vše od nuly a našel samostatnou větev Wget2 implementovat nápady k restrukturalizaci, zvýšení funkčnosti a provedení změn, které narušují kompatibilitu. S výjimkou ukončení podpory FTP a formátu WARC může wget2 ve většině situací fungovat jako transparentní náhrada za klasický nástroj wget.
S vydáním této verze funkce byla přesunuta do knihovny libwget spolu se kterým byl proveden přechod na vícevláknovou architekturu, s níž byla také poskytnuta možnost konfigurace více připojení paralelně a stahování ve více tocích. Pomocí možnosti „–chunk-size“ je dokonce možné paralelizovat stahování souboru s dělením do bloků.
Další novinka vyniká podporou protokolu HTTP / 2 vedle záhlaví HTTP If-Modified-Since ke stažení pouze upravených dat.
Zatímco část změn specifických pro OpenSSL opravuje kontrolu CRL, byla implementována ALPN a byly provedeny opravy k vyřešení problémů s úniky paměti.
Na druhou stranu je to také zmíněno informace o licenci byly aktualizovány, byly provedeny různé opravy v kompilacích na podporu kódování přijetí lzip a také na povolení seznamu tokenů pro připojení a na opravu konfliktu adresářů s –no-clobber.
Zatímco u části možností, které byly přidány, můžeme najít a zlepšení metody pro zpětnou kompatibilitu, vylepšení dat, byla přidána možnost –body-file zlepšující kompatibilitu s předchozími verzemi, dále možnost –ignore-length, –convert-file-only a –download-attr, aby bylo možné využít ‘atribut stahování’ z HTML5
Z dalších pozoruhodných změn které vyčnívají z poslední verze:
- –Roboty = možnost vypnuto přidána pro stahování robots.txt
- Přidána podpora pkg-config pro GPGME
- Korekce převodu (-k) byly provedeny v kombinaci s -E
- Opraveno rozpoznávání záhlaví souboru cookie příkazem 'file'
- Opravené načítání certifikátů CA, pokud není podporován systém
- Přejmenováno z –retry-on-http-status na –retry-on-http-error
- Omezení požadavků na stránky pouze pro listové stránky
- Opravte dereference NULL pomocí –convert-links
- Podporuje hypertextové odkazy terminálu na výstupu
- Nastavením přepínače –disable-manylibs deaktivujete vytváření malých knihoven
- Podpora - pozadí ve Windows
- Přidat možnost –bind-interface
- Přidejte užitečné zatížení HTTP2
- Podporuje atribut stahování HTML (pro značky a oblasti)
- Přidejte –download-attr = [strippath | usepath] k ovládání podpory atributů stahování
- OpenSSL: přidejte podporu OCSP
- OpenSSL: implementujte sešívání OCSP
- Údaje podpory: URL v atributu srcset
- Opraveny různé problémy
- Vylepšený kód, dokumentace, sestavení, testování, CI a další
Konečně pokud máte zájem o tom vědět více O této nové vydané verzi Wget2 se můžete podívat na podrobnosti Na následujícím odkazu.
Jak nainstalovat Wget2 na Linux?
Pro ty, kteří mají zájem o instalaci tohoto nástroje, by měli vědět, že v některých distribucích Linuxu mohou balíček najít ve svých úložištích.
Ačkoli mohou také sestavit balíček podle těchto pokynů. První věc, kterou musíme udělat, je získat zdrojový kód pomocí:
git clone https://gitlab.com/gnuwget/wget2.git cd wget2 ./bootstrap ./configure
Pokračujeme v kompilaci s:
make setarch x86 ./configure --prefix=/boot/home/config/non-packaged rm /boot/home/config/non-packaged/wget2 mv /boot/home/config/non-packaged/wget2_noinstall /boot/home/config/non-packaged/wget2 make check
A nakonec instalujeme pomocí:
sudo make install