Hallo Leute,
ich suche nach einer geeigneten Lösung für folgendes Szenario:
Im Unternehmensumfeld sollen Dateien aus verschiedenen Quellen (Externe Dienstleister, Intern) zentralisiert in einer Datenbank abgelegt und verwaltet werden.
Dabei werden die Daten (Dateien) von Dienstleistern per SSIS abgeholt und es soll weiterhin möglich, über ein intern zu verwendendes Tool "manuell" Dateien hinzuzufügen.
Dabei soll erkannt werden, ob eine Datei schon in der Datenbank vorhanden ist - das gilt sowohl beim SSIS-Import als auch bei Verwendung des Tools.
In meinem ersten Datenbankentwurf habe ich eine Tabelle in der die Dokumente als BLOB abgelegt werden und eine berechnete Spalte, die automatisch einen SHA1 (Hash) auf den Dateiinhalt kreiert.
Aufgrund des Hashes und des Dateinamens ergeben sich für mich beim Abgleich einer hinzuzufügenden Datei mit den Daten aus der Datenbank 4 Möglichkeiten:
Welche Möglichkeiten gibt es, eine Datei wenn möglich eindeutig zu identifizieren und Vorgänge wie Umbenennen, Ändern und Kombinationen davon zu erkennen?
PS: FileSystemWatcher oder ähnliche Verzeichnisüberwacher finden hier keine Anwendung da die Daten auch bei externen Firmen liegen
PPS: Ich weiß es schreit nach DMS, aber aus politschen, zeitlichen und monetären Gründen kommt das leider nicht in Frage
ich suche nach einer geeigneten Lösung für folgendes Szenario:
Im Unternehmensumfeld sollen Dateien aus verschiedenen Quellen (Externe Dienstleister, Intern) zentralisiert in einer Datenbank abgelegt und verwaltet werden.
Dabei werden die Daten (Dateien) von Dienstleistern per SSIS abgeholt und es soll weiterhin möglich, über ein intern zu verwendendes Tool "manuell" Dateien hinzuzufügen.
Dabei soll erkannt werden, ob eine Datei schon in der Datenbank vorhanden ist - das gilt sowohl beim SSIS-Import als auch bei Verwendung des Tools.
In meinem ersten Datenbankentwurf habe ich eine Tabelle in der die Dokumente als BLOB abgelegt werden und eine berechnete Spalte, die automatisch einen SHA1 (Hash) auf den Dateiinhalt kreiert.
Aufgrund des Hashes und des Dateinamens ergeben sich für mich beim Abgleich einer hinzuzufügenden Datei mit den Daten aus der Datenbank 4 Möglichkeiten:
- Dateihash ist gleich, Dateiname ist gleich --> es handelt sich um die gleiche Datei
- Dateihash ist gleich, Dateiname unterschiedlich --> die Datei wurde umbenannt ODER die Datei wurde kopiert und umbenannt
- Dateihash ist ungleich, Dateiname ist gleich --> Datei wurde geändert ODER neue Datei
- Dateihash ist ungleich, Dateiname ist ungleich -->Andere Datei ODER Datei wurde geändert und umbenannt
Welche Möglichkeiten gibt es, eine Datei wenn möglich eindeutig zu identifizieren und Vorgänge wie Umbenennen, Ändern und Kombinationen davon zu erkennen?
PS: FileSystemWatcher oder ähnliche Verzeichnisüberwacher finden hier keine Anwendung da die Daten auch bei externen Firmen liegen
PPS: Ich weiß es schreit nach DMS, aber aus politschen, zeitlichen und monetären Gründen kommt das leider nicht in Frage
Gruß Murdoc