Synology-Forum.nl

Overige software => File Station => Topic gestart door: Rikk op 12 november 2016, 13:30:43

Titel: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 13:30:43
Hi,

Ik zat zojuist even te kijken in Opslag-Analyser om te kijken of er nog duplicaten te vinden waren op mijn NAS. Ik kwam hier tot de ontdekking dat hij verschillende files als duplicaten zag, terwijl het geen duplicaten zijn... Het gaat hier om ISO bestanden, welke ik op mijn nas heb staan omdat ik ze enorm vaak gebruik..

Heeft een van jullie enig idee waarom hij onderstaande bestanden als duplicaten ziet?

(https://scrshot.eu/s/c450d70.png)

Bedankt alvast!
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Birdy op 12 november 2016, 13:37:39
Wat mij wel opvalt is, dat de time stamps van de files verschillen.
Backup ? Cloud ? of zo ?

[attachimg=1]
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 13:51:15
Deze verschillen omdat ze niet allemaal tegelijk op de nas zijn geplaatst... maar dat heeft toch niks hiermee te maken?

Ik draai inderdaad backups, maar heb niks teruggezet van een backup :).
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Birdy op 12 november 2016, 14:09:53
Ik heb getest maar ik krijg geen dups te zien.

Citaat
Deze verschillen omdat ze niet allemaal tegelijk op de nas zijn geplaatst...
Dat betreft natuurlijk de verschillende file-namen maar, ik zie time stamp verschillen van dezelfde file-namen.

[attachimg=1]
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 14:11:16
De namen van die files verschillen ook? Er staat bij de ene: (ENG) achter en bij de andere: (NED) en bij sommige Standard en sommige Datacenter? Dus wat is er hetzelfde aan?
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Birdy op 12 november 2016, 14:24:18
Ah....die had ik niet (goed) gezien :o
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 14:26:16
Haha, begrijpelijk  ;).

Ik blijf het dus vreemd vinden dat hij het als duplicaten ziet, iemand enig idee wat ik hieraan kan veranderen?
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Briolet op 12 november 2016, 14:28:47
Weet je zeker dat het verschillende files zijn?

Ik ga ervan uit dat hij naar filelengte en checksum kijkt. En dus juist niet naar filenaam en datum.
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Birdy op 12 november 2016, 14:29:42
Welke heb je gekozen ?

[attachimg=1]

Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 14:30:34
Ik heb ze gedownload vanaf de pagina die ik via school hiervoor heb, en de filename daarna gewijzigd en ze direct op de nas gezet. Lijkt mij dat het dan gewoon verschillende files zijn?
Aanvulling op bovenstaande: Zojuist 2012 standard en 2012 datacenter getest -> Beide verschillend, ik zat namelijk te twijfelen of ik niet per ongeluk 2x standard erop heb gezet met andere naam of andersom (2x datacenter) maar dat is niet het geval.

@Birdy ik heb beide vinkjes aan staan.
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Briolet op 12 november 2016, 14:38:11
Ga eens naar File Station, en kies de eigenschappen van beide files. Je hebt daar de optie om een MD5 checksum van beide bestanden te berekenen. Kijk eens of die gelijk zijn.

(De berekening duurt zo'n 30 sec. voor een 4 GB bestand op mijn nas. Op jouw J model nas zal dat langer duren.)
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 14:45:34
Dan komt er inderdaad exact hetzelfde uit... Is dit niet nogal vreemd omdat 't wel 2 verschillende bestanden zijn? En ik neem aan dat ik het niet kan veranderen?
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Ben(V) op 12 november 2016, 14:50:09
Een MD5 berekening kan voor twee verschillende bestanden nooit hetzelfde getal opleveren.
Dat kan echt alleen als de bestanden exact gelijk zijn.
Je zult dus wel een fout gemaakt hebben bij het kopieren en/of renamen.
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Birdy op 12 november 2016, 14:52:23
[attachimg=1]

[attachimg=2]

[attachimg=3]

[attachimg=4]

Trek je conclusies.
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 14:55:38
Een MD5 berekening kan voor twee verschillende bestanden nooit hetzelfde getal opleveren.
Dat kan echt alleen als de bestanden exact gelijk zijn.
En dat is dus helaas niet waar :(. Ik heb namelijk de 2 files met exact dezelfde MD5 checksum getal ding, getest als virtuele machine te draaien en bij 1tje krijg je de datacenter versie en bij de andere de standard versie, dus de files zijn niet het zelfde....
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Birdy op 12 november 2016, 15:02:11
Bij mij zijn de MD5 waarden exact hetzelfde ;)

[attachimg=1]

[attachimg=2]
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 15:04:24
Dat is bij mij ook, dus heb ik de bestanden nogmaals getest, als virtuele machine -> Verschillende iso's hoor :).

Dat de MD5 waarde hetzelfde is heeft dus met opslag-analyser als nadeel dat hij het als duplicaat ziet, maar het is het in ieder geval niet :S

Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Briolet op 12 november 2016, 15:54:26
Misschien dat die diks bij het opstarten naar zijn eigen filenaam kijkt en op grond daarvan anders reageert?  Geeft die ene iso eens de naam van de andere en start hem dan nog eens op.

De kans dat twee MD5 uitkomsten gelijk zijn grenst aan 0%. Dat het bij jouw 3 gebeurd zou ik zeker nul noemen.
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 16:02:14
Een iso kijkt niet naar de filename, de originele naam is totaal anders, maar de 2 die nu dezelfde md5 waarde krijgen, die heten bijna hetzelfde in originele naam hoor...
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Ben(V) op 12 november 2016, 16:53:26
Je zult toch echt wel iets verkeerd doen.
Het principe van een MD5 bepaling is juist ontwikkelt om te controleren of een bestand uniek is.
Als jij nu gaat roepen dat het niet functioneert en dat jij het goed doet lijkt me wat onzinnig.

Je doet gegarandeerd iets fout, want twee bestanden met dezelfde MD5 zijn echt exact gelijk, ook al hebben ze een andere naam en een andere timestamp.
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 16:59:07
@Ben(V) Ik weet dat MD5 daarvoor is gemaakt, maar een windows iso bevat eigenlijk altijd dezelfde bestanden, de inhoud van die bestanden is juist wel weer verschillend, maar in de iso zelf zit 99/100 keer dezelfde inhoud (Zie screenshot)

(https://scrshot.eu/s/cf8819f.png)

Het kan natuurlijk zo zijn dat de MD5 van de 2012 versies (De overeenkomende) exact hetzelfde zijn omdat het dus dezelfde inhoud heeft. Bij 2016 zal dat dus weer een andere zijn, en ook bij 2012 R2 weer een andere wat logisch is. Of denk ik nu compleet verkeerd? Een andere mogelijkheid dat ze hetzelfde zijn kan bijna niet, en ik doe zeker niks fout, ik heb het een aantal keer getest.
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Briolet op 12 november 2016, 18:34:36
Of de nas doet iets fout en berekend de MD5 van de verkeerde file. Gebruik eens dat windows progamma dat Birdy hierboven laat zien. Geeft die dezelfde waarde als de nas? (Zou moeten)

Zelfs als er maar één bitje anders is, moet je al een geheel andere MD5 krijgen.

Op de mac is het nog simpeler een MD5 uit te rekenen. Gewoon "MD5 [filenaam]" intikken in de terminal.

OpenSSL kent ook een MD5 berekening, dus op de nas kan dat ook met:
> openssl md5 [filenaam]
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 18:39:29
Dat programma heb ik al gebruikt, en kwam exact dezelfde waarde uit... Het zou inderdaad een andere MD5 moeten zijn... Ik begin nu wel ergens aan te twijfelen: Het zou natuurlijk kunnen zijn dat de iso inderdaad exact hetzelfde is, en windows pas kijkt welke versie van die iso het moet zijn als de key is ingevoerd? Toevallig kwam ik hier nu op omdat ik zojuist windows 10 moest installeren en met de pro key er een pro versie geladen werd en met de home key een home versie geladen werd... Dat zou dan een hoop verklaren, en ga ik nu ook meteen testen :D

Edit: Ik had dit eigenlijk moeten weten dus... het zijn blijkbaar exact dezelfde iso's, maar deze laad de juiste versie in zodra de product key is ingevoerd...
Iedereen toch bedankt voor de hulp!
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Briolet op 12 november 2016, 18:46:43
Dan werkt die "Dupplicate file" optie dus effectiever dan je gedacht had.  ;)
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Ben(V) op 12 november 2016, 18:49:12
Het zijn dus zoals ik al zei exact dezelfde bestanden. ;D
En is de find duplicate files gewoon wat slimmer dan jij. :lol:
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 18:50:18
@Briolet Haha inderdaad... we zullen het vanavond zien, de lijst is dan naar verwachting helemaal leeg :D

@Ben(V) Klopt ja :(. Dit had me ook veel tijd bespaard met het downloaden  :lol:
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Briolet op 12 november 2016, 20:07:18
Die MD5 test blijft onduidelijk als je de post van Birdy op de vorige pagina bekijkt.

Het lijkt er op dat die MD5 test alleen plaats heeft als je aanvinkt dat je èn de lengte en de filenaam wilt vergelijken.

Ik had dit in de help-file willen opzoeken, maar help heeft een bug die dit onmogelijk maakt.
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Birdy op 12 november 2016, 20:28:02
DSM Help on-line geeft geen verklaringen op die opties.
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Stief op 12 november 2016, 21:40:51
De windows iso's zijn gelijk.
Het is de gebruikte key waarmee bepaald wordt welke versie je kunt installeren.
Probeer het maar eens uit.
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 21:57:52
@Stief Bedankt, maar zoals hierboven vermeld: Dat heb ik inderdaad geprobeerd en dat was het dus :). Toch bedankt!
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Stief op 12 november 2016, 22:01:33
Haha,
 oeps zie dat ik de laatste paar posts over het hoofd gezien heb.

Nou in ieder geval voortaan niet meer twijfelen aan je DS ;)
Titel: Re: Waarom ziet de nas dit als duplicaten?
Bericht door: Rikk op 12 november 2016, 22:02:11
Haha geen probleem!
En dat komt goed :). Ik twijfelde meer aan het idee hoe de iso's opgebouwd waren, maar dat is nu dus ook duidelijk   :lol: