Auteur Topic: Bestanden met vreemde leestekens niet uit te pakken  (gelezen 9707 keer)

Stephan296

  • Gast
Bestanden met vreemde leestekens niet uit te pakken
« Gepost op: 29 december 2015, 15:05:25 »
Ik krijg de laatste tijd regelmatig bestanden van een bepaalde release groep.
hier staat het copyright teken in, hier kan linux/nzbget schijnbaar niet niet mee omgaan.
Downloaden is geen probleem, echter het uitpakken werkt niet.
Hij geeft dan een error op het uitpakken.
Na het downloaden de bestanden hernoemen werkt ook niet omdat de bestanden volgens dsm niet te benaderen zijn.
Is hier wat aan te doen, zodat nzbget de leestekens wel pakt?

Offline Birdy

  • Global Moderator
  • MVP
  • *
  • Bedankjes
  • -Gegeven: 1377
  • -Ontvangen: 7958
  • Berichten: 43.926
  • Beter een muisarm dan een apestaartje
    • Truebase
Re: Bestanden met vreemde leestekens niet uit te pakken
« Reactie #1 Gepost op: 29 december 2015, 15:42:53 »
  • Beste antwoord
  • Voor postprocessing is wel een script, lees deze eens door.
    Echter, jij hebt kennelijk OOK problemen met uitpakken maar, dat script kan je ook wel voor het uitpakken draaien. ;)
    Je kunt natuurlijk ook via PuTTY, als het uitpakken is mislukt van wegen dat soort tekens, ook handmatig wijzigen.


    CS406      DSM 2.0-0731    DS508      DSM 4.0-2265      DS411+II  DSM 6.2.4-25556-7   DS115J    DSM 7.1.1-42962-5   DS918+    DSM 6.2.4-25556-7
    DS107+     DSM 3.1-1639    DS411slim  DSM 6.2.4-25556   DS213J    DSM 6.2.4-25556-7   DS1515+   DSM 6.2.4-25556-7   DS220+    DSM 7.2.2-72806
    DS107+     DSM 3.1-1639    DS111      DSM 5.2-5967-9    DS413J    DSM 6.2.3-25426-2   DS716+II  DSM 7.2.2-72806     RT2600ac  SRM 1.2.5-8227-11
    BeeDrive   1TB             BeeServer  BSM 1.1-65373                                                                 MR2200ac  SRM 1.2.5-8227-11

    Offline Hutje

    • MVP
    • *
    • Bedankjes
    • -Gegeven: 201
    • -Ontvangen: 218
    • Berichten: 1.808
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #2 Gepost op: 29 december 2015, 16:45:35 »
  • Beste antwoord
  • Ik ervaar hetzelfde met SABnzbd.
    Echter wordt e.e.a. WEL goed uitgepakt.
    Alleen blijven de individuele RAR files achter. die niet weg willen.
    Oplossing is om complete folder in File Station te verwijderen.
    Lastig is het wel, zodra e.e.a. niet meer 'automatisch' normaal gaat.

    Misschien eens een berichtje richting die release groep ?


    DS1515+  [3x 8TB + 1x 4TB + 1x 3TB]  8 GB DDR3 DSM 6.1.7-15284 Update 3
    DS1512+  [3x 4TB + 2x 2TB]  4 GB DDR3 DSM 6.1.7-15284 Update 3
    DS411j     [3 x 2TB SHR] DSM 6.1.7-15284 Update 3
    DS211j     [TEST-NAS] DSM 6.1-15101
    RT1900    [AP-mode] SRM 1.2-7742
    UPS          APC Back-UPS ES 700G

    Stephan296

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #3 Gepost op: 29 december 2015, 17:40:25 »
  • Beste antwoord
  • Ik heb in ieder geval even mijn "locale" aangepast aangezien ik ook een probleem had met mijn leestekens op websites zoals spotweb.
    Nu heb ik wel een rename pp-script gevonden, maar ik krijg het nog niet voor elkaar om deze voor het unrar proces uit te laten voeren.

    Ben nog druk met google aan het stoeien ;-)

    Ben(V)

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #4 Gepost op: 29 december 2015, 17:41:16 »
  • Beste antwoord
  • Zoals je in de link die Birdy al geplaatst had kunt lezen heb ik een python scriptje aangpast zodat je daarmee een folder (+subfolder) kunt scannen en dan worden alle onleesbare tekens eruit gehaalt.
    zie:
    http://www.synology-forum.nl/optware-ipkg-telnet/(handleiding)-renamen-van-bestanden-met-vreemde-tekens/msg140985/#msg140985

    Het probleem is dat er (vaak windows-1252) code pages gebruikt worden om die rar bestanden te maken en dat alle systemen (behalve windows) tegenwoordig met utf-8 werken.

    UTF-8 is voor alle ascii karakter gelijk( code 32 t/m 127) aan zowel ascii als windows-1252, maar voor alle overige karakters(in alle talen) gebuikt hij twee bytes.

    Het codepage systeem gebruikt de overige codes van een byte (0 t/m 32 en 128 t/m 255) om "vreemde" tekens te maken en dan moet je ook nog weten welke code page gebruikt is.

    Een utf-8 systeem snapt daar niets van en met geluk maakt hij er iets leesbaars van maar vaak negeert hij het dan.

    Op zich is het niet zo moeilijk om een conversie te maken, maar er zijn vele code pages en als je niet weet welke gebruikt is om het rar bestand te maken blijft het gokken.

    Mijn advies is om torrents te gebruiken, die release groepen gebruiken gewoon utf-8.

    Stephan296

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #5 Gepost op: 29 december 2015, 18:41:02 »
  • Beste antwoord
  • Dat script had ik zeker gezien en ook uitgeprobeerd, echter wil ik het in nzbget draaien, na de par check maar voor het unrar proces.
    Gewoon een uitdaging ;-)

    Ben(V)

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #6 Gepost op: 29 december 2015, 19:49:14 »
  • Beste antwoord
  • Voor het unrar proces lijkt me niet zo zinvol.
    Als er in die rar bestandsnamen zitten met diakritiche karakter namen loop je alsnog vast.

    Offline Birdy

    • Global Moderator
    • MVP
    • *
    • Bedankjes
    • -Gegeven: 1377
    • -Ontvangen: 7958
    • Berichten: 43.926
    • Beter een muisarm dan een apestaartje
      • Truebase
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #7 Gepost op: 29 december 2015, 19:54:57 »
  • Beste antwoord
  • Misschien wel zinvol als de rar file namen zelf al die tekens heeft ?


    CS406      DSM 2.0-0731    DS508      DSM 4.0-2265      DS411+II  DSM 6.2.4-25556-7   DS115J    DSM 7.1.1-42962-5   DS918+    DSM 6.2.4-25556-7
    DS107+     DSM 3.1-1639    DS411slim  DSM 6.2.4-25556   DS213J    DSM 6.2.4-25556-7   DS1515+   DSM 6.2.4-25556-7   DS220+    DSM 7.2.2-72806
    DS107+     DSM 3.1-1639    DS111      DSM 5.2-5967-9    DS413J    DSM 6.2.3-25426-2   DS716+II  DSM 7.2.2-72806     RT2600ac  SRM 1.2.5-8227-11
    BeeDrive   1TB             BeeServer  BSM 1.1-65373                                                                 MR2200ac  SRM 1.2.5-8227-11

    Stephan296

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #8 Gepost op: 29 december 2015, 19:56:27 »
  • Beste antwoord
  • Hij wil hem niet uitpakken omdat die rar files die tekens bevatten. Daarom wilde ik hem voor het unrar proces laten renamen.

    Offline Birdy

    • Global Moderator
    • MVP
    • *
    • Bedankjes
    • -Gegeven: 1377
    • -Ontvangen: 7958
    • Berichten: 43.926
    • Beter een muisarm dan een apestaartje
      • Truebase
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #9 Gepost op: 29 december 2015, 19:57:57 »
  • Beste antwoord
  • Dat schrijf ik  :lol:


    CS406      DSM 2.0-0731    DS508      DSM 4.0-2265      DS411+II  DSM 6.2.4-25556-7   DS115J    DSM 7.1.1-42962-5   DS918+    DSM 6.2.4-25556-7
    DS107+     DSM 3.1-1639    DS411slim  DSM 6.2.4-25556   DS213J    DSM 6.2.4-25556-7   DS1515+   DSM 6.2.4-25556-7   DS220+    DSM 7.2.2-72806
    DS107+     DSM 3.1-1639    DS111      DSM 5.2-5967-9    DS413J    DSM 6.2.3-25426-2   DS716+II  DSM 7.2.2-72806     RT2600ac  SRM 1.2.5-8227-11
    BeeDrive   1TB             BeeServer  BSM 1.1-65373                                                                 MR2200ac  SRM 1.2.5-8227-11

    Stephan296

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #10 Gepost op: 29 december 2015, 20:09:38 »
  • Beste antwoord
  • Dat zeg ik: Gamma

    Ben(V)

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #11 Gepost op: 29 december 2015, 20:12:20 »
  • Beste antwoord
  • In dat geval moet het sript twee keer gedraait worden.

    Ik weet het niet meer zeker(heb er een hele tijd geleden eens naar gekeken) maar nzbget heeft toch op verschillende plaatsen mogelijkheden om externe scripts aan te roepen?
    Als dat op het juiste moment kan en de bestandsnaam van het rar bestand via zo'n enviroment variable is op te pikken is kan ik wel een scriptje voor je maken die de bestandsnaam omzet naar utf-8.

    Zal er morgen wel eens naar kijken, ik heb dat probleem ook al eens opgelost voor autosub als die subtitles in een zip file download, met diakritische karakters in de subs.

    Gaat het wel om rar of zip bestanden?

    Stephan296

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #12 Gepost op: 29 december 2015, 20:16:47 »
  • Beste antwoord
  • Het gaat in dit geval om rar bestanden.
    Moet alleen kijken hoe ik dat script voor het rar proces krijg.
    Ik heb wel een idee alleen nog niet getest.
    Om een script te maken die zowel het renamen als het unrarren aanroept.
    Dit script dan bij de instellingen aan te roepen waar de binary unrar wordt aangeroepen.
    Snap je het nog ;-)

    Ben(V)

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #13 Gepost op: 29 december 2015, 20:34:16 »
  • Beste antwoord
  • Heb even in de wiki van nzbget zitten lezen.
    Je kunt een nzbget een postprocess script laten aanroepen die het een en ander voor je doet.

    Ik zal kijken of ik een script kan maken die de de naam van de .rar omzet naar utf-8 alsmede de .rar uitpakt en de bestandsnamen daarin ook naar utf-8 omzet.
    Moet even zo'n bestand zien te vinden(of te maken) om te kunnen testen.

    Stephan296

    • Gast
    Re: Bestanden met vreemde leestekens niet uit te pakken
    « Reactie #14 Gepost op: 29 december 2015, 20:37:06 »
  • Beste antwoord
  • Ik heb wel een nzb voor je als je wilt.


     

    steeds langzamer bestanden overschrijven

    Gestart door robinthartBoard NAS hardware vragen

    Reacties: 3
    Gelezen: 2342
    Laatste bericht 08 februari 2013, 09:59:18
    door Dutchy036
    Probleem kopiƫren bestanden/mappen naar NAS (112J)

    Gestart door dickkieBoard FTP, NFS and Samba Server

    Reacties: 3
    Gelezen: 3037
    Laatste bericht 30 juli 2013, 12:11:36
    door Hofstede
    Geen geluid in moments bij sommige mp4 bestanden.

    Gestart door hahadminBoard Photo Station / Photos

    Reacties: 0
    Gelezen: 907
    Laatste bericht 23 oktober 2020, 14:26:44
    door hahadmin
    mediaspeler ziet geen bestanden.

    Gestart door Peter01Board FTP, NFS and Samba Server

    Reacties: 1
    Gelezen: 1403
    Laatste bericht 15 augustus 2021, 17:57:39
    door Peter01
    VERPLAATST: Bestanden beveiligen op Nas

    Gestart door BirdyBoard The lounge

    Reacties: 0
    Gelezen: 640
    Laatste bericht 29 december 2022, 14:16:59
    door Birdy