Synology-Forum.nl

Firmware => Synology DSM algemeen => Topic gestart door: SPiET op 27 september 2018, 16:07:44

Titel: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: SPiET op 27 september 2018, 16:07:44: Hallo iedereen,

Ik heb wat bestanden , groot en klein waar de bestandsnaam wel het zelfste zijn.

Bijv een film in bluray formaat XXX_1 en ook de film in mkv formaat XXX_A, enkel de groote en misschien wat extra in de bestandsnaam (en folder) verschillen.

Nu heb ik geprobeerd via opslag analyzer duplicate bestanden te vinden maar die geeft enkel wat identiek aan bestandsnaam duplicaat is .

Had graag geweten als er iets bestaat die mij bestanden en mappen weergeeft waar er enkele (zelf te kiezen) bestandsnamen in voorkomen. Een film van bluray en diezelfste in mkv formaat hebben soms een andere (de filmnaam blijft wel hetzelfste) bestandsnaam.

bedankt.
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: mchp92 op 27 september 2018, 16:14:12: Zoals ik je mail lees zijn de namen toch niet t zelfde, omdat er allerei nadere specificaties in verwerkt zijn. Het gaat je dus om bestanden met bv begintext/prefix, of de bestanden die allemaal een bepaalde tekenreeks in de naam hebben?

Nou heb ik al heel lang niet meer met mn vingers aan Unix gezeten, maar ik zou met iets als ssh een shell openen op de nas, en met n recursieve directory list de gewenste eruit greppen

Iets als “ls -lR | grep <jouw_zoektext>” of zoiets. Ken de opties van ls commando miet meer uit mn hoofd.
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: Ben(V) op 27 september 2018, 16:54:43: Je kunt toch gewoon op je PC met de verkenner een wildcard search doen.
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: SPiET op 27 september 2018, 17:25:44: @mchp92

Ja idd

voorbeeldje

film.a.is.de.beste.nl.1080p.bluray

film.a.is.de.beste.nl.5.1.1080p.mkv

film.a.is.de.beste.nl.iso

Dus 3x dezelfste film. De naam van de film is hetzelfste maar alle andere tekens die in de bestandsnaam EN map zitten niet.

Heb al es opslag analyzer laten draaien via DSM maar dit geeft niet het gewenste resultaat.

@Ben(V) : ja idd maar als je veel mapjes en bestanden hebt is dit nogal veel werk omdat je soms zelf niet meer weet wat je juist hebt. Daarmee is iets geautomatiseerd veel handiger, dat ben ik juist op zoek.

Mvg
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: Ben(V) op 27 september 2018, 17:44:19: Het stikt van op het internet van de duplicate file finder programma's voor windows.
Als programmeur kan je verzekeren dat zelf iets met grep in elkaar sleutelen gecompliceerder is dan dat het op het eerste gezicht lijkt.
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: mchp92 op 27 september 2018, 17:47:41: Ja dat weet ik
Heb ook de nodige jaren development ervaring op diverse platforms, ook unix
Grootste valkuil is dat je t steeds mooier en intelligenter wilt maken
En voor je t weet ben je dagen aan t klussen
Wat overigens wel weer heel leuk is ;-)
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: Briolet op 27 september 2018, 18:27:22: Citaat van: SPiET op 27 september 2018, 16:07:44
Nu heb ik geprobeerd via opslag analyzer duplicate bestanden te vinden maar die geeft enkel wat identiek aan bestandsnaam duplicaat is .

Opslag analyser haalt echt alle duplicate bestanden eruit, ook al is de naam totaal verschillend. Hij kijkt nml ook naar de md5 hash van een bestand.

Als dat bij jou mis gaat zijn het niet dezelfde bestanden. Als jij een film b.v. naar een ander formaat converteert, zijn het voor de analyzer natuurlijk twee verschillende bestanden, ook al ervaar jij het als dezelfde film.

Je kunt in de analyser de checkbox aanzetten om ook dubbele kandidaten te vinden. Staat bij mij uit, maar ik denk dat hij dan minder precies is en meer potentieel dubbele files vind. b.v. waar de md5 hash misschijn wel afwijkt, maar de naam gelijk is. Heb je die optie al eens geprobeerd?
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: Ben(V) op 27 september 2018, 19:42:51: Hij zoekt niet dezelfde bestanden maar look-a-likes.
En dat is precies het probleem.
Wat mensen heel voor de hand vinden liggen dat het dezelfde video is, is heel moeilijk in regels te vatten is.
Je komt dan op het gebied van "fuzzy logic", dus niet iets is waar of onwaar, maar iets is "ongeveer" waar of "lijkt erop".
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: Birdy op 27 september 2018, 20:09:48: Citaat van: SPiET op 27 september 2018, 17:25:44
@mchp92
voorbeeldje

film.a.is.de.beste.nl.1080p.bluray

film.a.is.de.beste.nl.5.1.1080p.mkv

film.a.is.de.beste.nl.iso

Dus 3x dezelfste film. De naam van de film is hetzelfste maar alle andere tekens die in de bestandsnaam EN map zitten niet.

Jouw voorbeeld werkt toch in Windows Verkenner ?
Of sla ik hier de plank volledig mis.

[attachimg=1]
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: Briolet op 27 september 2018, 21:30:39: Dan moet je elke naam handmatig invullen. Voor 1 file is dat ook simpel. Ik denk eerder dat hij een methode zoekt die geautomatiseerd een lijst van alle files maakt waar b.v. 80% van een aaneengesloten stuk karakters in de filenaam overeenkomt.

En het liefst nog gecombineerd met iets als gezichtsherkenning, zodat hij ook op basis van de inhoud, gelijke films vind.
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: Birdy op 27 september 2018, 21:41:53: Ja......das waar ::)
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: Vuurvreter op 27 september 2018, 23:20:34: Als je bestanden op de NAS opslaat, zorg je zelf toch voor een goede omschrijving om dit soort problemen te voorkomen?
Of zie ik dit verkeerd?
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: SPiET op 28 september 2018, 08:34:39: Wel sommigen onder jullie hebben inderdaad gelijk.

Kijk het zit zo.

Ik heb bijv een film in bluray formaat.

Later heb ik diezelfste film als remux, mkv of iso MAAR omdat het al lang geleden is weet ik soms niet meer of ik deze al heb in een ander formaat.

Daar zou het idd leuk zijn moest er een app bestaan of een manier om dit geautomatiseerd te laten verlopen want als je bijv al honderden films liggen hebt, dan weet je soms niet meer of je ze dubbel hebt (in een ander formaat).

Alles in verkenner ingeven is onbegonnen werk want dan moet je idd iedere film afzonderlijk ingeven.

Ik dacht dat die functie in opslag analyzer wel ging inzitten maar niet.
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: proxydude op 28 september 2018, 08:46:41: Of een film indexeert programma er op los laten. Zo als Kodi bijvoorbeeld?
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: dvandonkelaar op 28 september 2018, 08:55:21: Naast Kodi kun je ook je bibliotheek door Radarr laten indexeren, hierbij kun je ook meteen bestanden verwijderen die je niet nodig/dubbel hebt.
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: SPiET op 28 september 2018, 09:05:47: Toont ie met Radarr dan ook alle duplicaten, adh bepaalde woorden in de bestandsnaam/map?
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: Birdy op 28 september 2018, 09:09:10: Probeer: SearchMyFiles (https://www.techsupportalert.com/content/searchmyfiles.htm-0)

Snelle test gedaan:

[attach=1]
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: SPiET op 28 september 2018, 09:17:05: Bedankt Birdy maar daar moet je zelf nog altijd iets invullen voor ie begint te zoeken niet?

Ik bedoel infeite is waar de app zelf automatisch zoekt naar duplicaten zonder dat ik de bestandsnaam moet invullen. Denk bij Search My Files dat je zelf iets moet invullen en dan laat zoeken of er duplicaten zijn?
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: Birdy op 28 september 2018, 09:57:56: Citaat van: SPiET op 28 september 2018, 09:17:05
maar daar moet je zelf nog altijd iets invullen voor ie begint te zoeken niet?
In mijn voorbeeld kun je zien dat ik niets heb ingevuld, dus geheel standaard gelaten (behalve de directory).
Ga zelf maar eens testen of dit is wat je zoekt.

Nou, nog een voorbeeld dan:

[attachimg=1]
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: dvandonkelaar op 28 september 2018, 12:01:57: Citaat van: SPiET op 28 september 2018, 09:05:47
Toont ie met Radarr dan ook alle duplicaten, adh bepaalde woorden in de bestandsnaam/map?

Nee dat niet, volgens mij kun je dat nergens voor elkaar krijgen als de bestandsnaam verschillend is.
Je kunt alleen wel kijken welke films je exact hebt en zo nodig duplicaten verwijderen.

Verder kun je ook gewoon binnen Windows op *-* zoeken, dan 'klapt' hij alle mappen uit. Als je dan alfabetisch sorteert zie je automatisch welke bestanden op elkaar lijken. Net als SearchMyFiles.

Als je bestanden hebt die niet hetzelfde beginnen is het sowieso geen doorkomen aan denk ik. Je kunt ook alles door bijv. Radarr laten indexeren en de beste kwaliteit behouden, dat zorgt in ieder geval wel dat dit probleem niet meer voor komt.
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: Vuurvreter op 28 september 2018, 12:24:05: Is dit misschien iets?
Heb ff gezocht in de nieuwsgroepen ;)
En er is meer, zie afbeelding

Duplicate File Detective uses state-of-the-art file content analysis technology to show you exactly where your duplicate files are (even when the file names are different). You can search multiple folders, drives, removable storage devices, even network shares – all in a single pass. Then move, zip, or remove duplicate files safely with assistance from our innovative SmartMark duplicate file selection system.

Features:

Reclaim wasted local and network storage resources – archive or remove duplicate files
Speed up backup processes by reducing storage allocation redundancy
Gain visibility into what types of duplicates are consuming space and who owns them
Eliminate time wasted performing virus scans on duplicate files
Scan and de-dupe file systems of virtually any size with our extreme scalability engine
Process (move, delete, or zip) duplicates safely with our built-in file management system
Find duplicates by any combination of attributes, including content-only matching
De-dupe and clean up your music (MP3, iTunes, etc.) file collection
Optimized for Windows 8, Windows 7, Vista, XP and Windows Server (32 and 64 bit)
Native 64-bit support for unmatched performance and scalability.
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: SPiET op 28 september 2018, 13:38:31: Bedankt allemaal voor jullie reacties!

@Birdy, getest en idd , heb er (maar) 2, dacht een pak meer. Werkt wel maar vraag me af of ik nog iets beters kan vinden. Bedankt alleszins voor de info en moeite!

@Vuurvreter bedankt ook! NZBtje? ;) (edit: ah spotnet, spotweb?)
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: Vuurvreter op 28 september 2018, 15:22:17: Middels spotnet gevonden.
Titel: Re: Iemand een optie om duplicaat bestanden te vinden?
Bericht door: jr212 op 10 oktober 2018, 11:16:56: misschien is cmd-prompt en Excel samen een oplossing

win-r en dan cmd. zo kom je in de cmd-prompt
type: dir \\nas\share\pad\subpath /b /s>lijst.txt
open bestand "lijst.txt" in excel
in kolom b type je volgende formule: =DEEL(A1;VIND.ALLES("*";SUBSTITUEREN(A1;"\";"*";LENGTE(A1)-LENGTE(SUBSTITUEREN(A1;"\";""))))+1;LENGTE(A1))
doorvoeren voor alle bestanden en je heb een lijst met bestanden
via sorteren en verwijderen van punten en extensies kom je ook al een eind

jan