Oppure

Loading
05/01/14 16:57
jeremy23
Salve a tutti,

sono nuovo di VB.Net ma sto cimentandomi in qualche esperimento... se dico qualche sciocchezza spero mi perdonerete! :)

Ho scritto un codice in VB.net e all'interno di un testo HTML plottato in una TextBox, avrei la necessità di:
1) epurare le parti di testo che non mi interessano, sapendo che gli spezzoni di stringa che vorrei sono sempre collocati fra un numero e il simbolo parentesi come qui sotto:
"12:45 Testo di interesse (altre cose)"
a me interesserebbe la parte "Testo di interesse" collocato fra il carattere numerico "5" e la "(".
2) inoltre vorrei chiedervi se qualcuno sa come rimuovere dal testo HTML il simbolo rettangolare che sinceramente ho un po di difficoltà a descrivere. Facendo un copia-incolla su txt riesce ad trasferirsi, mentre se lo copio ad esempio nella barra di ricerca di ie non esce, sembra sia una specie di spazio.

ora come ora le pulizia del testo che ho portato avanti l'ha fatta con il

System.Text.RegularExpressions.Regex.Replace

ma sinceramente non saprei come procedere oltre.

Vi ringrazio dell'attenzione,
se potete darmi qualche suggerimento sono tutto orecchie!
aaa
05/01/14 19:13
jeremy23
vi faccio l'esempio di code con un sito a caso... yahoo... così potete vedere ai "rettangoli ai quali mi riferisco"

Imports System.Text.RegularExpressions
Public Class Form1
    Private Sub Button1_Click(ByVal sender As System.Object, _
          ByVal e As System.EventArgs) Handles Button1.Click
        Dim URL As String
        URL = "http://yahoo.it"
        Dim objScaricaURL As New ScaricaURL
        objScaricaURL.SetURL(URL)
        Me.TextBox1.Text = objScaricaURL.Scarica
    End Sub
    Private Sub Button2_Click(ByVal sender As System.Object, _
          ByVal e As System.EventArgs) Handles Button2.Click
        Dim URL As String
        URL = "http://yahoo.it"
        Dim objScaricaURL As New ScaricaURL
        objScaricaURL.SetURL(URL)


        Me.TextBox1.Text = _
           System.Text.RegularExpressions.Regex.Replace( _
           objScaricaURL.Scarica, "<[^>]*>", "")


' da qui non so come andare avanti... dovrei far sparire i "quadratini" e le catene di caratteri che non siano collocate fra un valore numerico qualsiasi e una parentesi (


    End Sub
End Class


manca la classe ma credo si capisca!

Ultima modifica effettuata da jeremy23 05/01/14 19:23
aaa