Auteur Topic: Bestanden met vreemde leestekens niet uit te pakken  (gelezen 8762 keer)

Dit onderwerp bevat een als beste antwoord gemarkeerd bericht. Klik hier om er direct naartoe te gaan.

Stephan296

  • Gast
Bestanden met vreemde leestekens niet uit te pakken
« Gepost op: 29 december 2015, 15:05:25 »
Ik krijg de laatste tijd regelmatig bestanden van een bepaalde release groep.
hier staat het copyright teken in, hier kan linux/nzbget schijnbaar niet niet mee omgaan.
Downloaden is geen probleem, echter het uitpakken werkt niet.
Hij geeft dan een error op het uitpakken.
Na het downloaden de bestanden hernoemen werkt ook niet omdat de bestanden volgens dsm niet te benaderen zijn.
Is hier wat aan te doen, zodat nzbget de leestekens wel pakt?

Offline Birdy

  • Global Moderator
  • MVP
  • *
  • Bedankjes
  • -Gegeven: 1343
  • -Ontvangen: 7824
  • Berichten: 43.256
  • FIFO / LIFO
    • Truebase
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #1 Gepost op: 29 december 2015, 15:42:53 »
Voor postprocessing is wel een script, lees deze eens door.
Echter, jij hebt kennelijk OOK problemen met uitpakken maar, dat script kan je ook wel voor het uitpakken draaien. ;)
Je kunt natuurlijk ook via PuTTY, als het uitpakken is mislukt van wegen dat soort tekens, ook handmatig wijzigen.


CS406      DSM 2.0-0731    DS508      DSM 4.0-2265      DS411+II  DSM 6.2.4-25556-7   DS115J    DSM 7.1.1-42962-5   DS918+    DSM 6.2.4-25556-7
DS107+     DSM 3.1-1639    DS411slim  DSM 6.2.4-25556   DS213J    DSM 6.2.3-25426-2   DS1515+   DSM 6.2.4-25556-7   DS220+    DSM 7.2.1-69057-5
DS107+     DSM 3.1-1639    DS111      DSM 5.2-5967-9    DS413J    DSM 6.2.3-25426-2   DS716+II  DSM 6.2.4-25556-7   RT2600ac  SRM 1.2.5-8227-11
BeeDrive   1TB             BeeServer  BSM 1.0-65162                                                                 MR2200ac  SRM 1.2.5-8227-11

Offline Hutje

  • MVP
  • *
  • Bedankjes
  • -Gegeven: 201
  • -Ontvangen: 218
  • Berichten: 1.808
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #2 Gepost op: 29 december 2015, 16:45:35 »
Ik ervaar hetzelfde met SABnzbd.
Echter wordt e.e.a. WEL goed uitgepakt.
Alleen blijven de individuele RAR files achter. die niet weg willen.
Oplossing is om complete folder in File Station te verwijderen.
Lastig is het wel, zodra e.e.a. niet meer 'automatisch' normaal gaat.

Misschien eens een berichtje richting die release groep ?


DS1515+  [3x 8TB + 1x 4TB + 1x 3TB]  8 GB DDR3 DSM 6.1.7-15284 Update 3
DS1512+  [3x 4TB + 2x 2TB]  4 GB DDR3 DSM 6.1.7-15284 Update 3
DS411j     [3 x 2TB SHR] DSM 6.1.7-15284 Update 3
DS211j     [TEST-NAS] DSM 6.1-15101
RT1900    [AP-mode] SRM 1.2-7742
UPS          APC Back-UPS ES 700G

Stephan296

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #3 Gepost op: 29 december 2015, 17:40:25 »
Ik heb in ieder geval even mijn "locale" aangepast aangezien ik ook een probleem had met mijn leestekens op websites zoals spotweb.
Nu heb ik wel een rename pp-script gevonden, maar ik krijg het nog niet voor elkaar om deze voor het unrar proces uit te laten voeren.

Ben nog druk met google aan het stoeien ;-)

Ben(V)

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #4 Gepost op: 29 december 2015, 17:41:16 »
Zoals je in de link die Birdy al geplaatst had kunt lezen heb ik een python scriptje aangpast zodat je daarmee een folder (+subfolder) kunt scannen en dan worden alle onleesbare tekens eruit gehaalt.
zie:
http://www.synology-forum.nl/optware-ipkg-telnet/(handleiding)-renamen-van-bestanden-met-vreemde-tekens/msg140985/#msg140985

Het probleem is dat er (vaak windows-1252) code pages gebruikt worden om die rar bestanden te maken en dat alle systemen (behalve windows) tegenwoordig met utf-8 werken.

UTF-8 is voor alle ascii karakter gelijk( code 32 t/m 127) aan zowel ascii als windows-1252, maar voor alle overige karakters(in alle talen) gebuikt hij twee bytes.

Het codepage systeem gebruikt de overige codes van een byte (0 t/m 32 en 128 t/m 255) om "vreemde" tekens te maken en dan moet je ook nog weten welke code page gebruikt is.

Een utf-8 systeem snapt daar niets van en met geluk maakt hij er iets leesbaars van maar vaak negeert hij het dan.

Op zich is het niet zo moeilijk om een conversie te maken, maar er zijn vele code pages en als je niet weet welke gebruikt is om het rar bestand te maken blijft het gokken.

Mijn advies is om torrents te gebruiken, die release groepen gebruiken gewoon utf-8.

Stephan296

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #5 Gepost op: 29 december 2015, 18:41:02 »
Dat script had ik zeker gezien en ook uitgeprobeerd, echter wil ik het in nzbget draaien, na de par check maar voor het unrar proces.
Gewoon een uitdaging ;-)

Ben(V)

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #6 Gepost op: 29 december 2015, 19:49:14 »
Voor het unrar proces lijkt me niet zo zinvol.
Als er in die rar bestandsnamen zitten met diakritiche karakter namen loop je alsnog vast.

Offline Birdy

  • Global Moderator
  • MVP
  • *
  • Bedankjes
  • -Gegeven: 1343
  • -Ontvangen: 7824
  • Berichten: 43.256
  • FIFO / LIFO
    • Truebase
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #7 Gepost op: 29 december 2015, 19:54:57 »
Misschien wel zinvol als de rar file namen zelf al die tekens heeft ?


CS406      DSM 2.0-0731    DS508      DSM 4.0-2265      DS411+II  DSM 6.2.4-25556-7   DS115J    DSM 7.1.1-42962-5   DS918+    DSM 6.2.4-25556-7
DS107+     DSM 3.1-1639    DS411slim  DSM 6.2.4-25556   DS213J    DSM 6.2.3-25426-2   DS1515+   DSM 6.2.4-25556-7   DS220+    DSM 7.2.1-69057-5
DS107+     DSM 3.1-1639    DS111      DSM 5.2-5967-9    DS413J    DSM 6.2.3-25426-2   DS716+II  DSM 6.2.4-25556-7   RT2600ac  SRM 1.2.5-8227-11
BeeDrive   1TB             BeeServer  BSM 1.0-65162                                                                 MR2200ac  SRM 1.2.5-8227-11

Stephan296

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #8 Gepost op: 29 december 2015, 19:56:27 »
Hij wil hem niet uitpakken omdat die rar files die tekens bevatten. Daarom wilde ik hem voor het unrar proces laten renamen.

Offline Birdy

  • Global Moderator
  • MVP
  • *
  • Bedankjes
  • -Gegeven: 1343
  • -Ontvangen: 7824
  • Berichten: 43.256
  • FIFO / LIFO
    • Truebase
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #9 Gepost op: 29 december 2015, 19:57:57 »
Dat schrijf ik  :lol:


CS406      DSM 2.0-0731    DS508      DSM 4.0-2265      DS411+II  DSM 6.2.4-25556-7   DS115J    DSM 7.1.1-42962-5   DS918+    DSM 6.2.4-25556-7
DS107+     DSM 3.1-1639    DS411slim  DSM 6.2.4-25556   DS213J    DSM 6.2.3-25426-2   DS1515+   DSM 6.2.4-25556-7   DS220+    DSM 7.2.1-69057-5
DS107+     DSM 3.1-1639    DS111      DSM 5.2-5967-9    DS413J    DSM 6.2.3-25426-2   DS716+II  DSM 6.2.4-25556-7   RT2600ac  SRM 1.2.5-8227-11
BeeDrive   1TB             BeeServer  BSM 1.0-65162                                                                 MR2200ac  SRM 1.2.5-8227-11

Stephan296

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #10 Gepost op: 29 december 2015, 20:09:38 »
Dat zeg ik: Gamma

Ben(V)

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #11 Gepost op: 29 december 2015, 20:12:20 »
In dat geval moet het sript twee keer gedraait worden.

Ik weet het niet meer zeker(heb er een hele tijd geleden eens naar gekeken) maar nzbget heeft toch op verschillende plaatsen mogelijkheden om externe scripts aan te roepen?
Als dat op het juiste moment kan en de bestandsnaam van het rar bestand via zo'n enviroment variable is op te pikken is kan ik wel een scriptje voor je maken die de bestandsnaam omzet naar utf-8.

Zal er morgen wel eens naar kijken, ik heb dat probleem ook al eens opgelost voor autosub als die subtitles in een zip file download, met diakritische karakters in de subs.

Gaat het wel om rar of zip bestanden?

Stephan296

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #12 Gepost op: 29 december 2015, 20:16:47 »
Het gaat in dit geval om rar bestanden.
Moet alleen kijken hoe ik dat script voor het rar proces krijg.
Ik heb wel een idee alleen nog niet getest.
Om een script te maken die zowel het renamen als het unrarren aanroept.
Dit script dan bij de instellingen aan te roepen waar de binary unrar wordt aangeroepen.
Snap je het nog ;-)

Gemarkeerd als beste antwoord door Gepost op 08 mei 2024, 16:33:23

Ben(V)

  • Gast
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #13 Gepost op: 29 december 2015, 20:34:16 »
  • Beste antwoord ongedaan maken
  • Heb even in de wiki van nzbget zitten lezen.
    Je kunt een nzbget een postprocess script laten aanroepen die het een en ander voor je doet.

    Ik zal kijken of ik een script kan maken die de de naam van de .rar omzet naar utf-8 alsmede de .rar uitpakt en de bestandsnamen daarin ook naar utf-8 omzet.
    Moet even zo'n bestand zien te vinden(of te maken) om te kunnen testen.

    Stephan296

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #14 Gepost op: 29 december 2015, 20:37:06 »
    Ik heb wel een nzb voor je als je wilt.


     

    Geen geluid in moments bij sommige mp4 bestanden.

    Gestart door hahadminBoard Photo Station / Photos

    Reacties: 0
    Gelezen: 777
    Laatste bericht 23 oktober 2020, 14:26:44
    door hahadmin
    mediaspeler ziet geen bestanden.

    Gestart door Peter01Board FTP, NFS and Samba Server

    Reacties: 1
    Gelezen: 1243
    Laatste bericht 15 augustus 2021, 17:57:39
    door Peter01
    Rechte bestanden

    Gestart door ds207Board Overige software

    Reacties: 2
    Gelezen: 3866
    Laatste bericht 08 september 2010, 10:28:45
    door Febiunz
    VERPLAATST: Bestanden beveiligen op Nas

    Gestart door BirdyBoard The lounge

    Reacties: 0
    Gelezen: 482
    Laatste bericht 29 december 2022, 14:16:59
    door Birdy
    bestanden buiten de server

    Gestart door AchoBoard File Station

    Reacties: 3
    Gelezen: 1461
    Laatste bericht 29 oktober 2018, 22:22:28
    door Acho