Cheksum generator to CSV?

Conoscete qualche app che prende una lista di files (immagini), genera il relativo checksum e li salva in uno spreadsheet ?



Potrei provare a farlo in python.... ma non c'ho sbatti di perderci tempo.
ma basta una riga!!!





*



Se mi dici che checksum e che estensioni vuoi te la scrivo io la riga
Quattro righe: 2 di import e 2 per calcolo checksum + export su file excel

https://github.com/hweickert/checksum
https://pandas.pydata.org/docs/reference/api/pandas.ExcelWriter.html#pandas.ExcelWriter
Io l'avrei scritto grezzo in csv, non con pandas, che mi sembra di caricare la death star per pulire la stanza
Lui ha chiesto uno spreadsheet, mi è venuto in automatico
Ma non lo vuole più? Io glielo scrivevo davvero

PS che cazzo è successo ai tuoi post?
Visto solo ora, grazie per l'aiuto
Sono riuscito a farmi uno scriptino in py, ma non proprio due righe, sono niubbo.

Hashing md5, va bene? Il checksum mi serve unicamente per individuare possibili duplicati man mano che carico le immagini in un catalogo.

Ora stavo cercando un modo per rendere le cose un po' più veloci, tipo farmi un exe per dropparci sopra la cartella di immagini di cui cui voglio il checksum.. ma sto un po' sclerando con py2exe. Mi sa che mi accontenterò della command line..



import hashlib
import csv
from os import listdir
from os.path import isfile, join, basename


mypath = "H:\mypath\topics"
dirname = os.path.basename(mypath)
onlyfiles = [ f for f in listdir(mypath) if isfile(join(mypath, f))]

def md5(fname):
hash_md5 = hashlib.md5()
with open(fname, "rb") as f:
for chunk in iter(lambda: f.read(4096), b""):
hash_md5.update(chunk)
return hash_md5.hexdigest()

hashes = [md5(join(mypath,f)) for f in onlyfiles]
csvFile = join(mypath, dirname + ".csv")

with open(csvFile, 'w') as file:
writer = csv.writer(file)
writer.writerow(["File Name", "md5 Hash"])
for item in zip(onlyfiles, hashes):
writer.writerow([item[0], item[1]])
non so lo scopo finale quale sia ma con il checksum se le immagini sono uguali ma di dimensione diversa avranno 2 checksum diversi (es le immagini che invii via whatsapp rispetto a quelle scattate)
per trovare quei duplicati il checksum non va bene. potresti provare dupdetector che è vecchio ma funziona ancora
Ah sì pensavo volessi controllare l'integrità delle pic, non cercare doppioni. Il checksum non va bene, anche quando sono identiche, stessa dimensione ecc., magari hanno l'exif diverso. Ci sono programmini per i doppioni delle pic.