Freundlichen Hyperlink unfreundlich machen
#1
Moin

wie wandle ich einen freundlichen Hyperlink so um, dass ich die Adresse lesen / weiterverarbeiten kann?

Ich habe eine Webside lokal gespeichert, dann den Seitenquelltext anzeigen lassen, diesen nach Notepad++ kopiert, wo mir der auch wunderbar angezeigt wird. Ich will nur die Zeilen haben, wo drinsteht
Zitat:www.hannovermesse.de/aussteller/

Hatte gehoft, ich kann in Excel danach filtern, geht aber nicht.
In Excel habe ich das ganze Tabellenblatt als text formatiert, dann aus Notepadd++ den Quelltext eingefügt und nun sieht das aus wie auf der Webside nur ohne Bilder, das Wort 'Austeller' in blau als freundlicher Hyperlink
Mit Strg+K bekomme ich zwar das Fenster Hyperlink in dem unten die Adresse drinsteht, aber bei 113.934 Zeilen muss es da was anderes geben.

Wie geht das?
Danke
Top
#2
Hallo Wastl,

das hatte ich hier gezeigt.
Den Rest bekommst Du doch hin, oder?  ;)

Gruß Carsten
Top
#3
@Wastl

auf Anhieb (irgendwann mal getestet) würden mir 2 Möglichkeiten einfallen:

- Regex: alle zwischen und auslesen
- XMLHttp und dem Knoten ""

Beim ersten Mal sind beide Wege nicht ganz trivial.

Brüße
Top
#4
Danke

Zitat:Hallo Wastl,

das hatte ich hier gezeigt.
Den Rest bekommst Du doch hin, oder?  [img]
Dateiupload bitte im Forum! So geht es: Klick mich!
]

das Thema hab ich nicht mehr vollständig mitbekommen, war anders beschäftigt.
Asche auf mein Haupt

Hab Excel nun überlistet:
Habe in Notepad++ alle '<' Zeichen durch '…' ersetzen lassen und dann nach Excel.
So konnte ich nun danach filtern
Top
#5
Hallöchen,

man könnte nach der Farbe filtern ... und hätte zumindest erst mal nur die Hyperlinks.
.      \\\|///      Hoffe, geholfen zu haben.
       ( ô ô )      Grüße, André aus G in T  
  ooO-(_)-Ooo    (Excel 97-2019+365)
Top
#6
Hhhmmm, könnte man ...
Aber warum, wenn man mit dem Tipp von mir gleich den unfreundlichen Link bekommt?


Gruß Carsten
Top
#7
Zitat:Hhhmmm, könnte man ...

Aber warum, wenn man mit dem Tipp von mir gleich den unfreundlichen Link bekommt?
Hi,

ich probiers aus, versprochen Exclamation

Es ist nur so, dass es, soweit ich mich erinnern kann, bis Excel 2003 solchen Blödsinn nicht gemacht hat.
Ich habe noch genug alte Dateien im Archiv wo die ganzen HTML/XML Texte aus dem Seitenquelltext drin sind.
Damals ging das so, Spalte als Text formatieren, dann einfügen und es blieb Text.
Top
#8
Hallo Wastl,

wenn ich Deinen Link aus der Frage kopiere und in Excel einfüge, wird der trotz Textformatierung als Link erkannt und es kann auch nach http gefiltert werden. Einen freundlichen Namen bekommt der aber nicht. Vielleicht kannst Du mal die ungeänderten Rohdaten in einer Textdatei hier anhängen.
.      \\\|///      Hoffe, geholfen zu haben.
       ( ô ô )      Grüße, André aus G in T  
  ooO-(_)-Ooo    (Excel 97-2019+365)
Top
#9
Moin,

Das Thema hatte ich schon länger auf erledigt gesetzt, aber seis drum, es geht ja auch ums lernen.
Ich arbeite schon 1,5 Tage mit dem was ich mir erstellt habe.
Und da ich schon länger mit Excel und VBA zu tun habe und weiß, dass wenn der eine Weg nicht geht, ich erst die 28 anderen Wege ausprobieren muss, bevor ich sagen kann, es geht nicht.
Meine Aufgabenstellung ist wie folgt:

…um die Aufbereitung einer Excelliste der Aussteller nach folgenden Kriterien:
 
Maschinen-und Anlagenbauer in DE (bitte keine Komponentenhersteller und keine Dienstleister)
-       Name des Unternehmens
-       Ansprechpartner
-       Adresse
-       Hauptprodukt des Unternehmens
-       Umsatz pro Jahr
-       Anzahl Mitarbeiter

Vieles steht direkt in der Ausstellerliste der Hannover Messe, vieles muss ich woanders zusammensuchen, oft auf deren einzelnen Websides, manches bekomme ich gar nicht.
Da die Recherche von anderen Seiten sehr aufwendig ist, würde ich sie gerne auf das Minimum beschränken.
Es gibt fast 4000 Austeller dort, und nur wenige sind für uns interessant.
Hier nun der Link dazu
http://www.hannovermesse.de/de/ausstellu...rzeichnis/

Im Anhang die gewünschte Textdatei stark verkleinert
Im Anhang meine Arbeitsdatei.
In Spalte A zähle ich die Leerzellen von B:L
In Spalte B gibts ein n oder ein y für interessant oder nicht, händisch
Der Bereich C:L ist mit bedingter Formatierung, so dass ich sofort sehe, welche Angaben ich noch nicht habe, dann ist Feld grau, mit Inhalt weiß
Zellenformatierung > Ausrictung > An Zellgröße anpassen.
Ich habe 2 Monitore, links einen 16:10 24-Zoll (1680x1200) für den Browser und rechts einen 4:3 19-Zoll für Excel (1280x1024)
darum sind die Spalten in Excel so schmal, damit ich bei den Eingaben nicht auch noch scrollen muss.
Die interessanten Inhalte einer Seite wie
http://www.hannovermesse.de/aussteller/bertfelt/W213120
kopiere ich aus dem Browser nach notepad++ und von dort nach Excel, in Excel wähle ich die entsprechende Zelle, drücke erst F2 und füge dann meine Texte ein.

Spalte C meiner Tabelle enthält das Wunschergebnis, was ich im ersten Post haben wollte. und auf Anhieb nicht funktionierte, weil das neue Excel nun auf XML aufbaut.
Die Links sind dort nicht so wie in C, ich musste es mir erst zusammenbauen, mein Trick aus #4 hat funktioniert.


Angehängte Dateien
.txt   Test.txt (Größe: 450,02 KB / Downloads: 11)
.xlsx   Mappe3.xlsx (Größe: 32,95 KB / Downloads: 4)
Top
#10
@Wastl

nach einem ersten Blick:

xl kann mit ca 5 Zeilen Code alle HREFs auslesen.

Aber die Infos "Company", "Ansprechpartner" (aus "inpect element" der genannten Messe WebSeite, sind nicht in dem Quellcode enthalten.

Nach wenigen Minute der Beschäftigung mit diesem Thema wäre mein Anstz aus dem gezeigten Quellcode alle URL mit "Austeller" auzulesen und dann einzeln aufrufen um die Daten Firmenname, Ansprechpartner usw auszulesen.

Wenn es keinen besseren Weg gibt, kann das Tage dauern.

mfg


Code:
"<a href="/aussteller/abbey-seals-international/A559839" class="overview-link" itemprop="url">
Top


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 1 Gast/Gäste