Synology-Forum.nl
Firmware => Synology DSM algemeen => Topic gestart door: SPiET op 27 september 2018, 16:07:44
-
Hallo iedereen,
Ik heb wat bestanden , groot en klein waar de bestandsnaam wel het zelfste zijn.
Bijv een film in bluray formaat XXX_1 en ook de film in mkv formaat XXX_A, enkel de groote en misschien wat extra in de bestandsnaam (en folder) verschillen.
Nu heb ik geprobeerd via opslag analyzer duplicate bestanden te vinden maar die geeft enkel wat identiek aan bestandsnaam duplicaat is .
Had graag geweten als er iets bestaat die mij bestanden en mappen weergeeft waar er enkele (zelf te kiezen) bestandsnamen in voorkomen. Een film van bluray en diezelfste in mkv formaat hebben soms een andere (de filmnaam blijft wel hetzelfste) bestandsnaam.
bedankt.
-
Zoals ik je mail lees zijn de namen toch niet t zelfde, omdat er allerei nadere specificaties in verwerkt zijn. Het gaat je dus om bestanden met bv begintext/prefix, of de bestanden die allemaal een bepaalde tekenreeks in de naam hebben?
Nou heb ik al heel lang niet meer met mn vingers aan Unix gezeten, maar ik zou met iets als ssh een shell openen op de nas, en met n recursieve directory list de gewenste eruit greppen
Iets als “ls -lR | grep <jouw_zoektext>” of zoiets. Ken de opties van ls commando miet meer uit mn hoofd.
-
Je kunt toch gewoon op je PC met de verkenner een wildcard search doen.
-
@mchp92
Ja idd
voorbeeldje
film.a.is.de.beste.nl.1080p.bluray
film.a.is.de.beste.nl.5.1.1080p.mkv
film.a.is.de.beste.nl.iso
Dus 3x dezelfste film. De naam van de film is hetzelfste maar alle andere tekens die in de bestandsnaam EN map zitten niet.
Heb al es opslag analyzer laten draaien via DSM maar dit geeft niet het gewenste resultaat.
@Ben(V) : ja idd maar als je veel mapjes en bestanden hebt is dit nogal veel werk omdat je soms zelf niet meer weet wat je juist hebt. Daarmee is iets geautomatiseerd veel handiger, dat ben ik juist op zoek.
Mvg
-
Het stikt van op het internet van de duplicate file finder programma's voor windows.
Als programmeur kan je verzekeren dat zelf iets met grep in elkaar sleutelen gecompliceerder is dan dat het op het eerste gezicht lijkt.
-
Ja dat weet ik
Heb ook de nodige jaren development ervaring op diverse platforms, ook unix
Grootste valkuil is dat je t steeds mooier en intelligenter wilt maken
En voor je t weet ben je dagen aan t klussen
Wat overigens wel weer heel leuk is ;-)
-
Nu heb ik geprobeerd via opslag analyzer duplicate bestanden te vinden maar die geeft enkel wat identiek aan bestandsnaam duplicaat is .
Opslag analyser haalt echt alle duplicate bestanden eruit, ook al is de naam totaal verschillend. Hij kijkt nml ook naar de md5 hash van een bestand.
Als dat bij jou mis gaat zijn het niet dezelfde bestanden. Als jij een film b.v. naar een ander formaat converteert, zijn het voor de analyzer natuurlijk twee verschillende bestanden, ook al ervaar jij het als dezelfde film.
Je kunt in de analyser de checkbox aanzetten om ook dubbele kandidaten te vinden. Staat bij mij uit, maar ik denk dat hij dan minder precies is en meer potentieel dubbele files vind. b.v. waar de md5 hash misschijn wel afwijkt, maar de naam gelijk is. Heb je die optie al eens geprobeerd?
-
Hij zoekt niet dezelfde bestanden maar look-a-likes.
En dat is precies het probleem.
Wat mensen heel voor de hand vinden liggen dat het dezelfde video is, is heel moeilijk in regels te vatten is.
Je komt dan op het gebied van "fuzzy logic", dus niet iets is waar of onwaar, maar iets is "ongeveer" waar of "lijkt erop".
-
@mchp92
voorbeeldje
film.a.is.de.beste.nl.1080p.bluray
film.a.is.de.beste.nl.5.1.1080p.mkv
film.a.is.de.beste.nl.iso
Dus 3x dezelfste film. De naam van de film is hetzelfste maar alle andere tekens die in de bestandsnaam EN map zitten niet.
Jouw voorbeeld werkt toch in Windows Verkenner ?
Of sla ik hier de plank volledig mis.
[attachimg=1]
-
Dan moet je elke naam handmatig invullen. Voor 1 file is dat ook simpel. Ik denk eerder dat hij een methode zoekt die geautomatiseerd een lijst van alle files maakt waar b.v. 80% van een aaneengesloten stuk karakters in de filenaam overeenkomt.
En het liefst nog gecombineerd met iets als gezichtsherkenning, zodat hij ook op basis van de inhoud, gelijke films vind.
-
Ja......das waar ::)
-
Als je bestanden op de NAS opslaat, zorg je zelf toch voor een goede omschrijving om dit soort problemen te voorkomen?
Of zie ik dit verkeerd?
-
Wel sommigen onder jullie hebben inderdaad gelijk.
Kijk het zit zo.
Ik heb bijv een film in bluray formaat.
Later heb ik diezelfste film als remux, mkv of iso MAAR omdat het al lang geleden is weet ik soms niet meer of ik deze al heb in een ander formaat.
Daar zou het idd leuk zijn moest er een app bestaan of een manier om dit geautomatiseerd te laten verlopen want als je bijv al honderden films liggen hebt, dan weet je soms niet meer of je ze dubbel hebt (in een ander formaat).
Alles in verkenner ingeven is onbegonnen werk want dan moet je idd iedere film afzonderlijk ingeven.
Ik dacht dat die functie in opslag analyzer wel ging inzitten maar niet.
-
Of een film indexeert programma er op los laten. Zo als Kodi bijvoorbeeld?
-
Naast Kodi kun je ook je bibliotheek door Radarr laten indexeren, hierbij kun je ook meteen bestanden verwijderen die je niet nodig/dubbel hebt.
-
Toont ie met Radarr dan ook alle duplicaten, adh bepaalde woorden in de bestandsnaam/map?
-
Probeer: SearchMyFiles (https://www.techsupportalert.com/content/searchmyfiles.htm-0)
Snelle test gedaan:
[attach=1]
-
Bedankt Birdy maar daar moet je zelf nog altijd iets invullen voor ie begint te zoeken niet?
Ik bedoel infeite is waar de app zelf automatisch zoekt naar duplicaten zonder dat ik de bestandsnaam moet invullen. Denk bij Search My Files dat je zelf iets moet invullen en dan laat zoeken of er duplicaten zijn?
-
maar daar moet je zelf nog altijd iets invullen voor ie begint te zoeken niet?
In mijn voorbeeld kun je zien dat ik niets heb ingevuld, dus geheel standaard gelaten (behalve de directory).
Ga zelf maar eens testen of dit is wat je zoekt.
Nou, nog een voorbeeld dan:
[attachimg=1]
-
Toont ie met Radarr dan ook alle duplicaten, adh bepaalde woorden in de bestandsnaam/map?
Nee dat niet, volgens mij kun je dat nergens voor elkaar krijgen als de bestandsnaam verschillend is.
Je kunt alleen wel kijken welke films je exact hebt en zo nodig duplicaten verwijderen.
Verder kun je ook gewoon binnen Windows op *-* zoeken, dan 'klapt' hij alle mappen uit. Als je dan alfabetisch sorteert zie je automatisch welke bestanden op elkaar lijken. Net als SearchMyFiles.
Als je bestanden hebt die niet hetzelfde beginnen is het sowieso geen doorkomen aan denk ik. Je kunt ook alles door bijv. Radarr laten indexeren en de beste kwaliteit behouden, dat zorgt in ieder geval wel dat dit probleem niet meer voor komt.
-
Is dit misschien iets?
Heb ff gezocht in de nieuwsgroepen ;)
En er is meer, zie afbeelding
Duplicate File Detective uses state-of-the-art file content analysis technology to show you exactly where your duplicate files are (even when the file names are different). You can search multiple folders, drives, removable storage devices, even network shares – all in a single pass. Then move, zip, or remove duplicate files safely with assistance from our innovative SmartMark duplicate file selection system.
Features:
Reclaim wasted local and network storage resources – archive or remove duplicate files
Speed up backup processes by reducing storage allocation redundancy
Gain visibility into what types of duplicates are consuming space and who owns them
Eliminate time wasted performing virus scans on duplicate files
Scan and de-dupe file systems of virtually any size with our extreme scalability engine
Process (move, delete, or zip) duplicates safely with our built-in file management system
Find duplicates by any combination of attributes, including content-only matching
De-dupe and clean up your music (MP3, iTunes, etc.) file collection
Optimized for Windows 8, Windows 7, Vista, XP and Windows Server (32 and 64 bit)
Native 64-bit support for unmatched performance and scalability.
-
Bedankt allemaal voor jullie reacties!
@Birdy, getest en idd , heb er (maar) 2, dacht een pak meer. Werkt wel maar vraag me af of ik nog iets beters kan vinden. Bedankt alleszins voor de info en moeite!
@Vuurvreter bedankt ook! NZBtje? ;) (edit: ah spotnet, spotweb?)
-
Middels spotnet gevonden.
-
misschien is cmd-prompt en Excel samen een oplossing
win-r en dan cmd. zo kom je in de cmd-prompt
type: dir \\nas\share\pad\subpath /b /s>lijst.txt
open bestand "lijst.txt" in excel
in kolom b type je volgende formule: =DEEL(A1;VIND.ALLES("*";SUBSTITUEREN(A1;"\";"*";LENGTE(A1)-LENGTE(SUBSTITUEREN(A1;"\";""))))+1;LENGTE(A1))
doorvoeren voor alle bestanden en je heb een lijst met bestanden
via sorteren en verwijderen van punten en extensies kom je ook al een eind
jan