Datenabgleich von 2 Spalten mit Namen
#1
Hallo Zusammen,

ich sitze gerade vor einem Problem in Excel und finde leider, auch nach etlichen Recherchen mit Dr.Google, keine Lösung.

Ich habe zum einem eine Spalte mit allen Unternehmensnamen aus unserem CRM System (33.000+)
In der nächsten Spalte habe ich weitere Daten mit Unternehmensnamen (600+) welche ich nun mit der ersten Spalte abgleichen möchte, damit ich weiß welche wir davon schon in unserem CRM-System gespeichert haben.

Das Problem ist es nun, da die Schreibweise der Unternehmen oft nicht identisch ist. In beiden Spalten ist es oft der Fall, dass die Unternehmensform (GmbH, AG, etc.) mal drin steht und mal nicht und auch die Reihenfolge der Wörter nicht immer übereinstimmt.
Bsp:
         Spalte 1              |          Spalte 2
Unternehmen A GmbH   |  A Unternehmen


Am besten geklappt hat es bisher die Legal entities herauszufiltern und dann einen Abgleich über den SVerweis zu machen. Leider matcht dieser hier die Spalten aber nicht und die Fehlerquote ist viel zu hoch.
Die 33.000+ bzw. 600+ Unternehmen händisch durchzugehen wäre Zeitlich zu Aufwendig. Vielleicht kennt hier jemand eine elegante Lösung?

Im Anhang habe ich ein Beispiel, wie die Liste aufgebaut ist. 

Vielen Dank schon einmal im Voraus. Vielleicht kann mir einer weiterhelfen  Huh


Angehängte Dateien Thumbnail(s)
   
Top
#2
Hallo,
warum sollte ich Dein Bild nachbauen?
Was soll den mit den übereinstimmenden  passieren?
Und mit diesem Beipiel wirst Du nicht die Lösung finden. Da sollten schon etwas unterschiedliche Beispiele vorkommen. (Unternehmen kommt überall vor!)
Grüße aus Nürnberg
Armin
Ich benutze WIN 10 (64bit) und Office 19 (32bit)
Top
#3
Hallo, 

die Unternehmen haben doch sicher eine Adresse , 

wenn nicht , dann ist ein Abgleich reine Lotterie !!

Vergleich nicht die Namen  sondern die  Adresse  

 PLZ + z.b die ersten  5 Stellen der Strasse   Links(Str ; 5)
Top
#4
Hallo Ebyas und Dieter,

danke für eure Antworten. 

@Ebyas: Das Bild sollte  nur als beispiel für die Logik dahinter dienen. Am besten wäre es wenn mir in einer Spalte danach angezeigt wird, welches Unternehmen aus Spalte 2 bereits in Spalte 1 vorkommt.

@Dieter: Das mit den Adressen ist eine gute Idee, leider habe ich aus der Liste mit den 600+ Namen die ich mit unseren Daten abgleichen möchte leider nur die Unternehmensnamen. Somit weder PLZ noch Straße.
Top
#5
Hallöchen,

zuerst musst Du Dir mal überlegen, wie nahe Du einer Lösung kommen willst. Ich gehe davon aus, dass es zu jeder Deiner 600 Firmen mehrere Treffer geben kann, oder auch mal keinen ...
Vielleicht beginnst Du mit einer Suche der Namen der 600er Liste per Autofilter in der großen Liste.

In der kurzen Liste hast Du vielleicht eine Fa. Meier

Dann suchst Du in der großen Liste mit dem Textfilter und der Bedingung "enthält" nach Meier. Fa. könnte ja in der großen Liste fehlen, oder das steht Firma, und nach Meier könnte GmbH, Gbr oder was auch immer kommen.

Sollte die Schreibweise Meier, Mayer, Meyer, Maier eine weitere Fehlerquelle sein, kannst Du auch nach M??er filtern. Die Fragezeichen ersetzen die zwei Zeichen.

Für die Sonderumlaute ä, ö und ü, die ja manchmal auch mit zwei Buchstaben geschrieben werden, nimmst Du beim Textfilter die Oder - Erweiterung.

z.B.
H?cker
oder
H??cker

wenn Du nach Höcker suchst. Ob der Hoecker dann ein Höcker ist oder wirklich ein Hoecker, musst Du entscheiden.

Interessant wird's, wenn Abkürzungen dazu kommen, z.B. VW WOB in der kurzen Liste und Volkswagen Wolfsburg in der langen …

Auch wenn's so aussieht, ich will die möglichen Schwierigkeiten nicht zu sehr in den Vordergrund rücken. Wenn's nur bei 2/3 oder der Hälfte der 600 passt hättest Du auch schon viel Arbeit gespart Smile
.      \\\|///      Hoffe, geholfen zu haben.
       ( ô ô )      Grüße, André aus G in T  
  ooO-(_)-Ooo    (Excel 97-2019+365)
Top
#6
Hallo

wenn ich so eine Aufgabe bekomme lege ich mir als erstes mal eine neue Datei zum "Spielen an"!  Lasse das Original wie es ist!

In der Spieldatei kannst du die Firmen nach Hedrzenslust sortieren, in einer 2. Spalte Texte löschen, nur um erst mal einen Überblick zu bekommen was da alles verdreht ist. Die guten, eindeutigen Datensaetze kopiere ich in eine neue Tabelle als "Gefundene Daten", und lösche sie in der Spieltabelle. Je kleiner der Datensatz wird, umso schneller blickst du durch. Und nicht vergessen sich Vermerke zu machen was Zusammengehört, aber verschieden geschrieben wurde. In der Datei kannst du selbst wenn du mal was falsch machst keine Original Daten versemmeln! 

Wenn du Strings mit Makros splitten kannst ist manches noch einfacher. Da kann man nach Hans Meier oder Meier, Hans suchen! Man kann auch mal die Firmierung abschneiden, z.B. für GmbH oder GmbH & Co. KG zu finden.

mfg Gast 123
Top


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 2 Gast/Gäste