Condividi:        

Estrazione dati specifici da HTML

Vuoi potenziare i tuoi documenti Word? Non sai come si fa una macro in Excel? Devi creare una presentazione in PowerPoint?
Oppure sei passato a OpenOffice e non sei sicuro di come lavorare al meglio?

Moderatori: Anthony47, Flash30005

Estrazione dati specifici da HTML

Postdi replymonster » 05/02/18 23:56

Buonasera a tutti,

Mi ritrovo di nuovo con un problema riguardo l'estrazione di dati specifici da un html, ma questa volta temo che la difficoltà sia superiore. Nello specifico, in questo sito https://5minuteconsult.com/collectionbrowse/6/drugs è presente una lista di 1900 principi attivi esistenti riguardo i farmaci. Io dovrei manualmente entrare in ognuno di essi e copiare ed incollare in Excel le indicazioni scritte sotto la sezione Indications, appunto. In questa specifica sezione vi è solitamente un testo in grassetto e neretto che vorrei fosse esportato sul foglio Excel mentre il resto può essere scartato, come si può vedere dall'immagine [https://imgur.com/AoAyp1v]. Ci tengo ad aggiungere che il formato per ogni principio attivo è essenzialmente lo stesso identico, per questo penso che forse sia possibile raggiungere l'obbiettivo richiesto.

Fatta la premessa inizio con il descrivere i vari problemi che non ho la competenza di valutare in termini di difficoltà:
1. Bisogna essere loggati con un account (gratuito con la sola richiesta di un email) per visualizzare l'intero contenuto per ogni principio attivo e non so se usando l'import di Excel possa essere un problema.
2. Bisognerebbe far in modo che entri in tutti i principi attivi in modo automatico e non ho la competenza di sapere se sia possibile.
3. Deve solo importare una parte di testo ignorando il resto ed inoltre di rado non è neanche presente (per cui dovrebbe semplicemente andare avanti lasciandolo vuoto)

Procedo con un esempio del risultato desiderato:
1. Principio Attivo | Indicazione | Indicazione | ...
2. Abacavir |HIV-1 infection
3. Abaloparatide | Osteoporosis
4. Abciximab | Percutaneous coronary intervention | Unstable angina/non-ST-elevation myocardial infarction
5. Aminocaproic Acid
6. Camphor | Cough |Pain | Pruritus/Pain

e cosi via ....

Spero di essere stato chiaro, ed aggiungo che anche una soluzione semi-automatica sarebbe molto gradita.
Vi ringrazio per il tempo che dedicherete anche solo alla lettura di questo post e vi auguro una buona serata.
replymonster
Utente Junior
 
Post: 30
Iscritto il: 06/11/17 11:45

Sponsor
 

Re: Estrazione dati specifici da HTML

Postdi Anthony47 » 06/02/18 11:52

Mi spiace, ma credo che quello che intendi fare sia una violazione dei termini di uso che vincolano legalmente gli utenti dei servizi online offerti da Wolters Kluwer Health, Inc.
Tra le cose che sono espressamente vietate:
  • download or print in whole or in substantial part the Online Service(s);
  • modify, translate, reverse engineer, decompile, disassemble, create derivative works of, or otherwise attempt to derive or alter any source code of the Online Service(s);
  • copy or permit the copying of the Online Service;
  • use the Online Service(s) to provide service bureau, time sharing, or similar services to third parties

L'eventuale accesso gratuito viene concesso solo per la valutazione dei servizi, vietando di fatto il reverse engineering necessario per sviluppare la macro:
  • If You received Trial Access to any Online Service(s), then WK grants You the non-transferable, nonexclusive, limited license to access and use the applicable Online Service(s) during the specified trial period on a single-user computer for the sole purpose of evaluating the applicable Online Service(s)

Pertanto non sono in grado di aiutarti in questa richiesta.

Il mio suggerimento e' che contatti il proprietario delle informazioni per discutere la possibilita' di accesso secondo i tuoi bisogni.

Ciao
Avatar utente
Anthony47
Moderatore
 
Post: 19196
Iscritto il: 21/03/06 16:03
Località: Ivrea


Torna a Applicazioni Office Windows


Topic correlati a "Estrazione dati specifici da HTML":


Chi c’è in linea

Visitano il forum: Ricky0185 e 57 ospiti