* * * *

Privacy Policy

Blog italiano

Clicca qui se vuoi andare al blog italiano su Lazarus e il pascal.

Forum ufficiale

Se non siete riusciti a reperire l'informazione che cercavate nei nostri articoli o sul nostro forum vi consiglio di visitare il
Forum ufficiale di Lazarus in lingua inglese.

Lazarus 1.0

Trascinare un file nel programma
DB concetti fondamentali e ZeosLib
Recuperare codice HTML da pagina web
Mandare mail con Lazarus
Stabilire il sistema operativo
Esempio lista in pascal
File INI
Codice di attivazione
Realizzare programmi multilingua
Lavorare con le directory
Utilizzare Unità esterne
TTreeView
TTreeview e Menu
Generare controlli RUN-TIME
LazReport, PDF ed immagini
Intercettare tasti premuti
Ampliare Lazarus
Lazarus e la crittografia
System Tray con Lazarus
UIB: Unified Interbase
Il file: questo sconosciuto
Conferma di chiusura di un applicazione
Liste e puntatori
Overload di funzioni
Funzioni a parametri variabili
Proprietà
Conversione numerica
TImage su Form e Panel
Indy gestiore server FTP lato Client
PopUpMenu sotto Pulsante (TSpeedButton)
Direttiva $macro
Toolbar
Evidenziare voci TreeView
Visualizzare un file Html esterno
StatusBar - aggirare l'errore variabile duplicata
Da DataSource a Excel
Le permutazioni
Brute force
Indy 10 - Invio email con allegati
La gestione degli errori in Lazarus
Pascal Script
Linux + Zeos + Firebird
Dataset virtuale
Overload di operatori
Lavorare con file in formato JSON con Lazarus
Zeos ... dietro le quinte (prima parte)
Disporre le finestre in un blocco unico (come Delphi)
Aspetto retrò (Cmd Line)
Lazarus 1.0
Come interfacciare periferica twain
Ubuntu - aggiornare free pascal e lazarus
fpcup: installazioni parallele di lazarus e fpc
Free Pascal e Lazarus sul Raspberry Pi
Cifratura: breve guida all'uso dell'algoritmo BlowFish con lazarus e free pascal.
Creare un server multithread
guida all'installazione di fpc trunk da subversion in linux gentoo
Indice
DB concetti fondamentali e connessioni standard
Advanced Record Syntax
DB concetti fondamentali e DBGrid
DB concetti fondamentali e TDBEdit, TDBMemo e TDBText
Advanced Record Syntax: un esempio pratico
Superclasse form base per programmi gestionali (e non)
Superclasse form base per programmi gestionali (e non) #2 - log, exception call stack, application toolbox
Superclasse form base per programmi gestionali (e non) #3 - traduzione delle form
Superclasse form base per programmi gestionali (e non) #4 - wait animation
Un dialog per la connessione al database:TfmSimpleDbConnectionDialog
Installare lazarus su mac osx sierra
immagine docker per lavorare con lazarus e free pascal
TDD o Test-Driven Development
Benvenuto! Effettua l'accesso oppure registrati.
Novembre 24, 2024, 01:45:10 am

Inserisci il nome utente, la password e la durata della sessione.

49 Visitatori, 1 Utente
 

Autore Topic: Lettere accentate nei nomi di files  (Letto 8602 volte)

bonmario

  • Hero Member
  • *****
  • Post: 1360
  • Karma: +11/-1
Lettere accentate nei nomi di files
« il: Febbraio 12, 2013, 02:21:18 pm »
Ciao a tutti,
sto cercando da un'ora, ma non trovo niente.

Allora, devo fare un programma che rinomina i files, facendo in modo che se nel nome dei files c'è una lettera accentata, tale lettera sia sostituita con la analoga non accentata. Per capirci, "Menù" viene rinominato in "Menu".

Il problema è che il nome del file mi arriva nel formato UTF8, in cui le lettere accentate occupano 2 bytes invece di 1 (#195 + il codice della lettera accentata).
Quindi, non posso fare un ciclo for per leggere un carattere alla volta, perché mi sballa per tutte le lettere accentate.

Che voi sappiate, esistono delle funzioni che mi permettono di scorrere una stringa UTF8 e che mi ritornano un carattere alla volta o devo farmela io?

Grazie, Mario

xinyiman

  • Administrator
  • Hero Member
  • *****
  • Post: 3276
  • Karma: +12/-0
Re:Lettere accentate nei nomi di files
« Risposta #1 il: Febbraio 12, 2013, 03:41:39 pm »
hai giq provato con la stringreplace?!
Ieri è passato, domani è futuro, oggi è un dono...

nomorelogic

  • Global Moderator
  • Hero Member
  • *****
  • Post: 2921
  • Karma: +20/-4
Re:Lettere accentate nei nomi di files
« Risposta #2 il: Febbraio 12, 2013, 05:01:11 pm »
Imagination is more important than knowledge (A.Einstein)

bonmario

  • Hero Member
  • *****
  • Post: 1360
  • Karma: +11/-1
Re:Lettere accentate nei nomi di files
« Risposta #3 il: Febbraio 12, 2013, 06:43:21 pm »
Con stringreplace è andata, grazie.

Però per l'ottimizzazione del codice non mi piace ... mi spiego: con stringreplace, siccome devo sostituire tutte le lettere accentate, alla fine la stringa che contiene il nome del file, viene elaborata 6 volte, una per ogni lettera accentata
Codice: [Seleziona]
    NomeFile:=StringReplace(NomeFile, 'à', 'a''', [rfReplaceAll]);
    NomeFile:=StringReplace(NomeFile, 'è', 'e''', [rfReplaceAll]);
    NomeFile:=StringReplace(NomeFile, 'é', 'e''', [rfReplaceAll]);
    NomeFile:=StringReplace(NomeFile, 'ì', 'i''', [rfReplaceAll]);
    NomeFile:=StringReplace(NomeFile, 'ò', 'o''', [rfReplaceAll]);
    NomeFile:=StringReplace(NomeFile, 'ù', 'u''', [rfReplaceAll]);

Io invece preferivo scansionare il nome del file una volta sola e, se mi ritrovavo per le mani una lettera accentata, fare la sostituzione.
Purtroppo però non ho trovato nulla che mi permetta di scansionare una stringa UTF8 un carattere alla volta, o meglio, ho trovato questa http://wiki.freepascal.org/Theodp che permette di scansionare, però poi non permette di trattare il singolo carattere in maniera semplice.

Ciao, Mario

Stilgar

  • Global Moderator
  • Hero Member
  • *****
  • Post: 2389
  • Karma: +10/-0
Re:Lettere accentate nei nomi di files
« Risposta #4 il: Febbraio 12, 2013, 08:45:43 pm »
Hai provato con le espressioni regolari?
Al mondo ci sono 10 tipi di persone ... chi capisce il binario e chi no.

Stilgar

  • Global Moderator
  • Hero Member
  • *****
  • Post: 2389
  • Karma: +10/-0
Re:Lettere accentate nei nomi di files
« Risposta #5 il: Febbraio 12, 2013, 09:03:32 pm »
http://regexpstudio.com/TRegExpr/Help/tregexpr_interface.html#tregexpr.substitute

L'ho usato una volta ... molto carino e performante ;)
Usi un "gruppo" per lettera che ti interessa.
Poi hai vari modi per gestire come sostituire ;) il $xxx ... usi esattamente il blocco selezionato, ma è proprio quello che vuoi eliminare e cambiare ;)
(Buon divertimento a trovare l'espressione che ti interessa :P )
Stilgar
Al mondo ci sono 10 tipi di persone ... chi capisce il binario e chi no.

bonmario

  • Hero Member
  • *****
  • Post: 1360
  • Karma: +11/-1
Re:Lettere accentate nei nomi di files
« Risposta #6 il: Febbraio 13, 2013, 09:21:17 am »
Grazie del consiglio, ma le espressioni regolari le potrei studiare solo in ferie, avendo a disposizione qualche settimana per ragionarci su !!!
Ci ho già provato un paio di volte in passato, ma ho sempre dovuto alzare bandiera bianca !!!

In ogni caso, casomai capitasse a qualcuno in futuro la stessa cosa, ieri ho fatto un po' di ricerche su Internet, stamattina ho fatto delle prove, ed ho capito come risolvere il problema.
Ecco il codice:
Codice: [Seleziona]
  function SistemaNomeFile(NomeFileInp:String):String;
  var IdxChr, TotChr:Integer;
      NomeDir, NomeFile, NomeExt, NomeFileOut, ChrNew, ChrOld:String;
  begin
    //Inizizlizzazione output
    Result:='';

    //Scompongo il nome che mi arriva in directory, nome file ed estensione
    NomeDir:=ExtractFileDir(NomeFileInp);
    NomeFile:=ExtractFileNameOnly(NomeFileInp);
    NomeExt:=ExtractFileExt(NomeFileInp);

    //Correggo il nome del file
    NomeFileOut:='';
    IdxChr:=0;
    TotChr:=Length(NomeFile);

    while (IdxChr < TotChr) do begin
      //Valorizzo il carattere successivo
      IdxChr:=IdxChr + 1;
      ChrOld:=NomeFile[IdxChr];
      //Se il carattere è UTF8, devo leggere anche quello successivo
      if (ChrOld = #194) or
         (ChrOld = #195) then begin
       IdxChr:=IdxChr + 1;
       ChrOld:=ChrOld + NomeFile[IdxChr];
      end;

      case ChrOld of
        '0'..'9', 'a'..'z', 'A'..'Z', ' ', '-', '.', '_', '''': begin
          ChrNew:=ChrOld;
        end;
        'à':ChrNew:='a''';
        'è':ChrNew:='e''';
        'é':ChrNew:='e''';
        'ì':ChrNew:='i''';
        'ò':ChrNew:='o''';
        'ù':ChrNew:='u''';
        else
          begin
            ChrNew:='_';
          end;
      end;

      //Adesso che l'eventuale sostituzione è stata fatta, posso aggiungere il carattere
      //alla stringa ricodificata
      NomeFileOut:=NomeFileOut + ChrNew;
    end;

    //Ricompongo il nome completo
    Result:=NomeDir +
            PathDelim +
            NomeFileOut +
            NomeExt;
  end;

Il senso del tutto è che un sibgolo carattere può essere composto da 1 o 2 bytes. E composto da 2 bytes se il primo dei 2 è #194 o #195. Quindi, se scorrendo la stringa mi capita uno di quei 2 bytes, il carattere su cui fare il confronto sarà composto da quel byte e da quello successivo.

Grazie a tutti, Mario

Stilgar

  • Global Moderator
  • Hero Member
  • *****
  • Post: 2389
  • Karma: +10/-0
Re:Lettere accentate nei nomi di files
« Risposta #7 il: Febbraio 13, 2013, 09:26:13 am »
Mario, non darti per vinto. ;)
Le espressioni regolari non meno difficili di quello che sembrano.
Stilgar
Al mondo ci sono 10 tipi di persone ... chi capisce il binario e chi no.

bonmario

  • Hero Member
  • *****
  • Post: 1360
  • Karma: +11/-1
Re:Lettere accentate nei nomi di files
« Risposta #8 il: Febbraio 13, 2013, 01:25:17 pm »
Sono la mia bestia nera ... ma prima o poi le imparerò !!!

Ciao, Mario

 

Recenti

How To

Utenti
  • Utenti in totale: 803
  • Latest: maXim.FI
Stats
  • Post in totale: 19180
  • Topic in totale: 2288
  • Online Today: 97
  • Online Ever: 900
  • (Gennaio 21, 2020, 08:17:49 pm)
Utenti Online
Users: 1
Guests: 49
Total: 50

Disclaimer:

Questo blog non rappresenta una testata giornalistica poiché viene aggiornato senza alcuna periodicità. Non può pertanto considerarsi un prodotto editoriale ai sensi della legge n. 62/2001.