De ce este nevoie de XML? Fișier XML: ce este și cum se deschide

În esență, standardizarea face posibil ca obiecte diferite să interacționeze între ele - o lanternă și baterii, Macromedia Flash și un server de jocuri multiplayer și așa mai departe. De asemenea, în World Wide Web, unde cantități uriașe de date se mișcă în fiecare secundă, este extrem de importantă standardizarea modului în care datele sunt schimbate între sisteme. Puternic și ușor de utilizat, XML devine rapid un standard atât de acceptat.

În această lecție, vă vom prezenta elementele de bază ale formatului XML și vă vom arăta cum pot fi utilizate obiectele XML și XMLSocket în Flash. Până la sfârșitul lecției, veți putea „vorbi” Flash cu paginile ASP pentru a înregistra conectările utilizatorilor; De asemenea, vom crea un chat simplu în timp real folosind un server socket.

Ce se va studia

În această lecție:

  • Format XML
  • Trimiterea datelor XML către server și încărcarea acestora de pe server
  • Crearea unui nou obiect XML
  • Aplicarea metodelor, proprietăților și evenimentelor obiect XML
  • Stabilirea unei conexiuni la un server socket folosind Flash

Aplicația simplă de chat pe care o vom codifica în acest tutorial va folosi o conexiune socket XML.

Perioada de graţie

Această lecție durează aproximativ o oră și jumătate.

Fișiere de lecție

Fișiere media:

Fișiere de pornire:

Lesson12/Assets/LoginRegister1.fla Lesson12/Assets/Chat1.fla

Proiecte finalizate:

LoginRegister2.fla Chat2.fla

elementele de bază xml

Deși numele XML, sau eXtensible Markup Language, sună oarecum misterios, înțelegerea și stăpânirea acestui limbaj nu este deloc dificilă. În esență, XML este o modalitate de formatare și structurare a informațiilor pe care aplicațiile care primesc o pot interpreta și utiliza. De fapt, toți, poate fără să știm noi înșine, avem o vastă experiență în structurarea și organizarea informațiilor. Să luăm acest exemplu.

Când vrei să-i scrii o scrisoare unui prieten, trebuie să-ți structurezi gândurile (informațiile) într-un format pe care prietenul tău îl poate recunoaște. Deci, începi să scrii cuvinte pe o bucată de hârtie, începând din colțul din stânga sus și împărțind gândurile în paragrafe, propoziții și cuvinte. Desigur, ai putea scrie nu de la stânga la dreapta, ci cumva într-un cerc, sau chiar să încerci să-ți transmiți gândurile prin imagini, dar această metodă nu va duce, cel mai probabil, prietenul tău decât la nedumerire. Și scriind o scrisoare într-un format pe care prietenul tău este familiarizat, poți fi sigur că mesajul tău va fi înțeles - adică transferul gândurilor tale (date, informații) către destinatarul scrisorii va avea succes.


XML este, de asemenea, destinat aceluiași format - este un format pentru transmiterea informațiilor. Dacă, de exemplu, doriți să trimiteți date din Flash către un server web pentru procesare, trebuie mai întâi să prezentați datele în format XML. Apoi serverul poate interpreta corect aceste date și le poate folosi. Fără aceasta, serverul, după ce a primit mai multe porțiuni de date, nu ar ști ce să facă cu prima porțiune, ce cu a doua și ce legătură are prima porțiune cu a doua. Datorită XML, aceste date disparate sunt pline de semnificație, iar serverul își poate da seama cum să lucreze cu ele.

Sintaxa XML, precum HTML, folosește etichete, atribute și valori, dar aici se termină asemănările. În timp ce HTML utilizează etichete predefinite (cum ar fi body, head sau html ), în XML, utilizatorul își creează propriile nume, în loc să aleagă nume predefinite dintr-o bibliotecă. Să începem cu acest document XML simplu:

Kelly Makar Mike Grundvig Makar liber

Fiecare etichetă XML se numește nod ( nodul), un set de date în format XML se numește document XML. Documentul nostru exemplu are un nod rădăcină, MyFriends și trei noduri copil. Fiecare document XML poate conține un singur nod rădăcină. Primul dintre nodurile copil are numele de nod Nume și valoarea nodului Kelly Makar. Cuvântul Gen din fiecare nod copil este un atribut. Atributele sunt opționale; fiecare nod poate avea un număr nelimitat de atribute. În mod obișnuit, atributele sunt folosite pentru a conține informații mici care nu trebuie să fie afișate pe ecran (de exemplu, un ID de utilizator).


După cum puteți vedea în acest exemplu, etichetele (pe care le-am creat și descris noi înșine) dau sens unor informații (Kelly Makar, Mike Grundvig și Free Makar).

Următorul document XML este un exemplu mai complex de structurare.

Kelly Makar 121 Baker Street vreun oraș Carolina de Nord Tripp Carter 777 O altă stradă Elizabeth City Carolina de Nord

Acest exemplu arată cum ar putea arăta datele din agendă în format XML. Dacă ar fi 600 de persoane în agenda noastră, atunci nodul Persoană ar fi repetat de 600 de ori cu aceeași structură.

Cum ar trebui să vă creați nodurile, structura dvs.? Cum recunoaște obiectul destinatar (pagina ASP, soclu etc.) formatarea documentului? Răspunsul este simplu - mijloacele pentru a face acest lucru trebuie să fie încorporate în obiectul destinatar. De exemplu, dacă am creat o agendă de adrese în Flash și dorim să punem informațiile pe care le conține într-o bază de date, trebuie să trimitem versiunea XML a cărții noastre către o pagină ASP (sau altă pagină de script) care poate analiza informațiile. și plasați datele în câmpurile corespunzătoare.Baza de date . Trebuie să înțelegeți că acest script de pagină ASP trebuie proiectat în prealabil pentru a procesa datele în mod corespunzător. XML este mai potrivit pentru transmiterea de informații decât pentru stocare; prin urmare, este mai convenabil să stocăm datele din agenda noastră în înregistrările bazei de date decât sub forma unui document XML. Când este necesar, informațiile pot fi extrase din baza de date, folosind un script special, convertite în format

Luați în considerare tehnologia utilizării XML pentru a transfera date către server.

Am luat în considerare deja 2 moduri de a transfera date pe server: este un text simplu cu un delimitator și JSON. Dar au dezavantaje:

  • Lipsa tipurilor de date. JSON are doar șir, număr, nul, boolean. Acestea. set limitat de date.
  • Este dificil de controlat integritatea datelor transmise.
  • Este dificil de vizualizat datele, de ex. obiectele complexe sunt greu de afișat, de exemplu, sub formă de cod html.
  • Este dificil să transformi datele, de ex. este dificil să convertiți proprietățile unui obiect în proprietățile altui obiect.

Acum să trecem la XML ca o modalitate de a transmite date. XML(eXtensible Markup Language) - un limbaj de marcare conceput pentru a descrie, stoca și transfera date structurate. Astăzi, XML este folosit peste tot.

Există multe tehnologii bazate pe XML: DOM (interacțiune programatică cu datele), XLink (pointeri și legături), XPath (descrierea și selecția elementelor), XSL, XSLT (transformarea documentului XML).

Analizarea pachetului XML arată astfel:

// obiect XMLHttpRequest var req= getXmlHttpRequest (); //Instalarea handler-ului solicitat onreadystatechange= funcția () ( dacă (req. readyState== 4 ) ( //stare "4 - complet" var xml = req. răspunsXML; ))

Aici, nici măcar serializarea și deserializarea nu trebuie făcute. Acest lucru este realizat de obiectul însuși. Imediat ce serverul trimite date XML, acestea sunt deja analizate (responseXML - model de document DOM). Citiți mai multe despre tehnologia DOM în articolele anterioare de pe site.

Uneori, pentru depanare, este necesară serializarea și deserializarea datelor XML (pentru a transfera date pe server, acest lucru se face automat, nu trebuie să o faceți manual). Să serializăm într-un șir:

//pentru IE var str = dom. xml //pentru Firefox var serializer = new XMLSerializer(); var str = serializator. serializeToString(dom);

Pentru IE, codul de lucru este mai scurt. are deja încorporat un obiect pentru serializare, în timp ce alte browsere au doar un obiect XMLSerializer pentru serializare.

Când lucrăm cu date XML, de obicei ne ocupăm de modelul DOM al documentului. Prin urmare, merită să ne amintim câteva puncte ale DOM (citiți despre asta în articolele anterioare). Permiteți-mi să vă reamintesc numai modalități de a accesa elementul DOM al modelului:

//element rădăcină var root = xmlDOM. documentElement; //primul element din colecție varbook = root. childNodes[ 0 ]; //element copil var title = carte. childNodes[ 0 ]; // element text nod alert(title.firstChild.nodeValue);

De asemenea, puteți selecta elemente de același tip din DOM-ul modelului de document. Atenţie! Funcțiile getElemensById - nu, deoarece în XML, id poate însemna orice, nu doar un identificator, deci nu este folosit.

//selectați toate elementele cu aceeași etichetă var books = xmlDOM. getElementsByTagName("carte");

XML este, de asemenea, utilizat în mod activ nu numai pentru a reprezenta date, ci și pentru a face schimb de date într-o arhitectură orientată spre server. Aceasta este o abordare în care prezentăm o aplicație complexă nu ca o aplicație clasică client-server, ci ca un set de servicii (servicii), fiecare fiind responsabil de propriile sarcini. Și fiecare serviciu are puncte de intrare (puncte de interacțiune). Nu există un client clar aici, pentru că un serviciu poate fi client al altui serviciu. Se pare că o astfel de tehnologie distribuită. Există mai multe abordări pentru construirea unor astfel de tehnologii - apel de procedură la distanță, SOAP.

Pentru ca serviciile diferiților clienți să interacționeze, aceștia trebuie să vorbească aceeași limbă (nu contează ce sistem de operare are serviciul). Și un astfel de limbaj a fost dezvoltat și numit RPC.

Protocolul XML-RPC

RPC(Remote Procedure Call) - apel de procedură de la distanță. Este un protocol de comunicare între două puncte la distanță. Permite punctului „a” să apeleze o funcție pe un punct la distanță „b”.

Există mai multe implementări ale protocolului RPC. Luați în considerare o implementare bazată pe XML.

De fapt, clientul și serverul pur și simplu schimbă câteva fragmente XML.

XML-RPC oferă următoarele tipuri de date:

  • boolean.
  • întreg.
  • dubla.
  • şir.
  • data/ora.
  • baza64.
  • matrice.
  • struct.
  • nul.

Acestea. atunci când treceți un anumit tip de date, trebuie să declarați despre ce fel de date este vorba. Structura este ca un obiect JSON.

Transformarea datelor XML

XSLT este folosit pentru a transforma datele primite de la server ca XML.

XSLT(eXtendable Stylesheet Language Transformation) este o tehnologie care ajută la obținerea XML ca intrare și pentru a forma orice la ieșire.

Conversia XSLT în javaScript - IE

var dom = new ActiveXObject("MSXML2.DOMDocument"); dom. asincron=fals dom var xsl = nou ActiveXObject(" [email protected]"); xsl.async = fals; xsl.load("my.xsl"); //transformarea în sine varresult = dom. transformNode(xsl);

Convertiți XSLT în javaScript pentru Firefox. Chrome, Opera

varxslStylesheet; var xsltProcessor var myXMLHTTPRequest = mew XMLHttpRequest(); myXMLHTTPRequest. open("GET" , "example.xsl" , false); myXMLHTTPRequest. trimite(null); //get xml xslStileshett = myXMLHTTPRequest. răspunsXML; xsltProcessor myXMLHTTPRequest = new XMLHttpRequest(); myXMLHTTPRequest. open("GET" , "example.xml" , false); myXMLHTTPRequest. trimite(null); //transformarea în sine var xmlSource = myXMLHTTPRequest. răspunsXML; var resultDocument = xsltProcessor. transformToDocument(xmlSource);

XML (Extensible Markup Language) a fost dezvoltat de grupul de lucru XML al World Wide Web Consortium (W3C). Iată cum îl descriu creatorii:

„Extensible Markup Language (XML) este un subset al SGML... Este conceput pentru a facilita utilizarea SGML pe Web și pentru a efectua sarcini care sunt realizate în prezent cu HTML. XML este conceput pentru a îmbunătăți utilizarea și interoperabilitatea SGML și HTML.”

Acesta este un extras din specificația XML versiunea 1.0 creată de XML Working Group în februarie 1998. Întregul document poate fi găsit pe site-ul web W3C la http://www.w3.org/TR/REC/-xml .

XML este un limbaj de marcare conceput special pentru găzduirea informațiilor pe World Wide Web, similar cu Hypertext Markup Language (HTML), care a devenit inițial limbajul standard pentru crearea paginilor Web. Deoarece limbajul HTML satisface complet toate nevoile noastre, se pune întrebarea: de ce a fost nevoie de un limbaj complet nou pentru Web? Care sunt avantajele și dezavantajele sale? Cum interacționează cu HTML? Va înlocui HTML sau doar îl va îmbunătăți? În cele din urmă, ce este SGML, din care XML face parte și de ce nu ar trebui folosit SGML pentru paginile Web? În acest capitol, voi încerca să răspund la toate aceste întrebări.

Scopul XML

Limbajul HTML oferă un set fix de elemente pe care le puteți utiliza pentru a plasa componente pe o pagină web tipică. Exemple de astfel de elemente sunt titluri, paragrafe, liste, tabele, imagini și link-uri. De exemplu, HTML este excelent pentru

crearea unei pagini de pornire personale. Mai jos este o descriere a paginii de start în coduri HTML:

Pagina principala

Pagina de pornire a lui Michael Young

Bun venit pe site-ul meu!

Conținutul site-ului web

Vă rugăm să alegeți unul dintre următoarele subiecte:

  • Scris
  • Familie
  • Galerie foto

Alte site-uri web interesante

Faceți clic pe una dintre următoarele pentru a explora un alt site Web:

  • "unu. XML ar trebui să fie limba de utilizare directă pe Internet.”

    După cum probabil ați ghicit până acum, XML a fost conceput în primul rând pentru a stoca și a distribui informații pe Web.

    „2. XML va suporta un număr mare de aplicații.”

    În timp ce scopul său principal este de a distribui informații pe Web prin servere și browsere, XML este, de asemenea, conceput pentru a fi utilizat de alte programe. De exemplu, XML este folosit pentru a face schimb de informații între programe financiare, pentru a distribui și actualiza produse software și pentru a scrie scripturi vocale pentru furnizarea de informații prin telefon.

    „3.XML va fi compatibil cu SGML.”

    XML este o ramură specializată a SGML. Avantajul aici este că instrumentele SGML pot fi ușor adaptate pentru a lucra cu HTML.

    „patru. Va fi mai ușor să scrieți programe care procesează documente XML.”

    Utilizarea practică a XML necesită să fie destul de ușor să scrieți browsere și alte programe care procesează documente XML. De fapt, principalul motiv pentru separarea XML de SGML a fost accesibilitatea programelor de scriere pentru a procesa documente XML.

    „5. Numărul de caracteristici suplimentare din XML ar trebui să fie minim și, în mod ideal, zero.”

    Numărul minim de funcții suplimentare în XML facilitează scrierea de programe pentru procesarea documentelor XML. Mulțimea de plug-in-uri suplimentare în SGML a fost un motiv major pentru care nu este practic pentru reprezentarea documentelor Web. Funcțiile SGML suplimentare necesită redefinirea caracterelor delimitare pentru etichete (de obicei ) și omiterea etichetei de capăt astfel încât procesorul să detecteze capătul elementului. La scrierea riguroasă a unui program de procesare a documentelor SGML, este necesar să se țină cont de posibilitatea tuturor funcțiilor suplimentare, chiar dacă acestea sunt rare.

    „6. Documentele XML ar trebui să fie înțelese și clare pentru utilizator.”

    XML se dorește a fi lingua franca (limba universală) pentru schimbul de informații între utilizatori și programe din întreaga lume. Conform acestui concept, utilizatorii, precum și programele specializate, ar trebui să poată crea și citi documente XML. Accesibilitatea și transparența pentru utilizator distinge XML de majoritatea celorlalte formate utilizate în construirea bazelor de date și a documentelor text.

    Utilizatorul poate citi cu ușurință un document XML deoarece este descris în text simplu și are o structură arborescentă ierarhică logică. Puteți simplifica documentele XML dând nume semnificative elementelor, atributelor și obiectelor și adăugând comentarii utile. (Acest lucru va fi discutat mai târziu în acest capitol.)

    „7. Dezvoltarea XML ar trebui finalizată destul de repede.”

    XML va deveni un standard acceptat doar dacă programatorii și utilizatorii îl acceptă. Acest standard ar trebui creat înainte ca societatea să accepte standardele alternative care sunt din ce în ce mai create de companiile de software.

    "opt. Limbajul XML ar trebui să fie formal și concis.”

    Specificația XML este scrisă într-un limbaj formal folosit pentru a reprezenta limbaje informatice, cu o notație cunoscută sub numele de Extended Backus-Naur Form (EBNF). Acest limbaj formal, deși destul de complex de înțeles, este lipsit de ambiguitate și facilitează foarte mult scrierea documentelor XML și în special a programelor pentru procesarea acestora.

    „9. Documentele XML vor fi mai ușor de creat.”

    Prin utilizarea practică a XML ca limbaj de marcare pentru documentele Web, nu numai scrierea programelor de procesare este simplificată, ci și procesul de creare a documentelor XML în sine.

    "zece. Forma comprimată nu este importantă în marcajul XML.”

    În conformitate cu clauza 6 (documentul XML trebuie să fie clar și ușor de înțeles pentru utilizator), marcajul XML nu trebuie să fie prea concis pentru a nu intra în conflict cu scopul specificat.

    Aplicații XML standard

    Puteți utiliza XML pentru mai mult decât pentru a descrie un singur document. Un utilizator individual, o companie sau un comitet de standarde poate defini setul necesar de elemente XML și structura documentului pentru a fi aplicate unei anumite clase de documente. Un astfel de set de elemente și o descriere a structurii documentului se numește aplicație XML sau dicționar XML.

    De exemplu, o organizație poate defini o aplicație XML pentru crearea de documente care descriu structuri moleculare, resurse umane, prezentări multimedia sau care conțin grafică vectorială. La sfârșitul capitolului este o listă cu câteva aplicații XML comune care au fost deja create și aplicații care sunt planificate să fie create.

    O aplicație XML este de obicei definită prin crearea unui Document Type Descriptor (DTD), care este o componentă validă a unui document XML. Un DTD este construit în jurul unei scheme de bază de date: stabilește și definește numele elementelor care pot fi utilizate într-un document, ordinea în care pot apărea elementele, atributele elementului care pot fi aplicate și alte caracteristici ale documentului. Pentru utilizarea practică a unei aplicații XML, de obicei includeți DTD-ul acesteia în documentul dumneavoastră XML; Prezența unui DTD într-un document limitează elementele și structurile pe care le veți utiliza, astfel încât documentul dumneavoastră să se conformeze standardelor aplicației respective. Descrierile documentelor XML discutate mai devreme în acest capitol nu au inclus un DTD. Veți învăța cum să definiți și să utilizați DTD-uri în Capitolul 5.

    Avantajele utilizării aplicațiilor XML standard atunci când dezvoltați documentele sunt că puteți partaja documente cu toți ceilalți utilizatori ai aplicației, iar documentul poate fi procesat și afișat folosind software-ul care este deja creat pentru acea aplicație.

    Aplicații XML care îmbunătățesc calitatea documentelor XML

    Pe lângă aplicațiile XML pentru descrierea anumitor clase de documente, există mai multe aplicații XML pe care le puteți utiliza în orice tip de document XML. Aceste aplicații facilitează crearea unui document și îmbunătățesc calitatea acestuia. Următoarele sunt exemple de astfel de aplicații.

    • Extensible Stylesheet Language (XSL) vă permite să creați foi de stil puternice folosind sintaxa XML.
    • Schema XML vă permite să dezvoltați scheme detaliate pentru documentele dvs. XML utilizând sintaxa XML standard, care este o alternativă mai puternică la utilizarea DTD-urilor.
    • XML Linking Language (XLink) vă oferă posibilitatea de a vă conecta documentele XML. Acceptă link-uri țintă multiple și alte caracteristici utile, oferind mai multă libertate decât mecanismul de organizare a linkurilor din HTML.
    • XML Pointer Language (XPointer) vă permite să definiți legături țintă flexibile. Când utilizați împreună XPointer și XLink, puteți organiza legături către orice loc din documentul țintă - nu doar săriți la paragrafe special marcate.

    XLS va fi discutat în Capitolul 10. Alte aplicații XML nu sunt încă mature și nu sunt acoperite în această carte. (XLink și XPointer nu sunt acceptate în Internet Explorer 5).

    După cum puteți vedea, XML nu este doar un instrument util pentru descrierea documentelor, dar servește și ca un cadru pentru construirea de aplicații și extensii care pot fi utile pe măsură ce Internetul evoluează.

    Utilizarea reală a XML

    Deși conceptul de XML este destul de interesant, s-ar putea să vă întrebați cum să îl puneți în practică. Această secțiune oferă o listă de exemple de astfel de utilizări ale XML, atât în ​​uz comun, cât și în viitor. Dacă există aplicații XML relevante pentru utilizare practică, acestea vor fi date între paranteze. De exemplu, puteți afla că aplicația MathML XML vă va permite să formatați formule matematice.

    Legătură. Pentru o listă mai completă a aplicațiilor XML actuale și viitoare, inclusiv descrieri detaliate, consultați pagina Web Oasis SGML/XML (http://www.oasis-open.arg/cover/ocml.htmW aplicații).

    • Lucrul cu baze de date. La fel ca bazele de date tradiționale, XML poate fi folosit pentru a eticheta fiecare câmp de informații din fiecare intrare de bază de date. (De exemplu, puteți eticheta fiecare nume, adresă și număr de telefon în intrările din lista de adrese.) Apoi puteți afișa datele într-o varietate de moduri și puteți aranja căutarea, sortarea, filtrarea și alte procesări ale datelor.
    • Documente de structurare. Structura ierarhică a documentelor XML este ideală pentru marcarea structurii documentelor, cum ar fi romane, lucrări științifice și piese de teatru. De exemplu, puteți utiliza XML pentru a marca o piesă pentru acte, scene, personaje, povești, peisaje și așa mai departe. Marcarea XML permite programelor să afișeze sau să imprime un document în formatul de care au nevoie; găsiți, extrageți sau manipulați informații dintr-un document; generați cuprinsuri, rezumate și adnotări; procesează informații în alte moduri.
    • Lucrul cu grafica vectoriala (VML - Vector Markup Language).
    • Prezentări multimedia (SMIL - Synchronized Multimedia Integration Language, HTML + TIME - HTML Timed Interactive Multimedia Extensions).
    • Descrierea canalelor. Canalele sunt pagini Web care sunt trimise automat abonaților. (CDF - Channel Definition Format).
    • Descrierea pachetelor software și a interrelațiilor acestora. Astfel de descrieri asigură distribuția și actualizarea produselor software în rețea (OSD - Open Software Description).
    • Interacțiunea aplicației pe Web folosind co-comunicații XML. Aceste mesaje sunt independente de sistemele de operare, modele de obiecte și limbaje informatice (SOAP - Simple Object Access Protocol).
    • Trimiterea de cărți de vizită electronice prin e-mail.
    • Schimb de informații financiare. Schimbul de informații într-un format deschis și ușor de înțeles se realizează între programe financiare (cum ar fi Quicken și Microsoft Money) și instituții financiare (bănci, fonduri publice) (OFX - Open Financial Exchange).
    • Creați, gestionați și utilizați formulare digitale complexe pentru tranzacții comerciale pe internet. Astfel de formulare pot include semnături digitizate care le fac recunoscute legal (XFDL - Extensible Forms Description Language).
    • Schimb de cereri de locuri de muncă și CV-uri (HRML - Human Resource Management Markup Language).
    • Formatarea formulelor matematice și a informațiilor științifice în
    • Web (MathML - Mathematical Markup Language).
    • Descrierea structurilor moleculare (CML - Chemical Markup Language).
    • Codarea și afișarea informațiilor despre ADN, ARN și lanțuri (BSML - Bioinformatic Sequence Markup Language).
    • Codarea datelor genealogice (GeDML - Genealogical Data Markup Language).
    • Schimb de date astronomice (AML - Astronomical Markup Language).
    • Crearea de partituri muzicale (MusicML - Music Markup Language).
    • Lucrul cu scripturi vocale pentru a furniza informații prin telefon. Scripturile vocale pot fi folosite, de exemplu, pentru a genera mesaje vocale, întrebări privind stocurile și prognoze meteo (VoxML).
    • Prelucrarea și livrarea informațiilor prin servicii de curierat. Federal Express, de exemplu, folosește deja XML în acest scop.
    • Prezentarea reclamei in presa in format digital (AdMarkup).
    • Completarea actelor juridice și schimbul electronic de informații juridice (XCL - XML ​​​​Court Interface).
    • Codificarea prognozei meteo (OMF - Weather Observation Markup Format).
    • Schimb de informații privind tranzacțiile imobiliare (RETS - Real Estate Transaction Standard).
    • Schimb de informații privind asigurarea.
    • Schimb de știri și informații folosind standarde web deschise (XMLNews).
    • Reprezentarea informațiilor religioase și marcarea textelor de cult (ThML - Theological Markup Language, LitML - Liturgical Markup Language).

    O introducere în marcarea corectă

    XML mijloace Limbajul de marcare extensibil, cu accent pe marcare(marcare). Puteți crea text și îl puteți marca cu etichete de împachetare, transformând fiecare cuvânt, propoziție sau bucată în informații identificabile și sortabile. fișierele pe care le creați sau instanțele documentare, constau din elemente (etichete) și text, iar elementele ajută la înțelegerea corectă a documentului la citirea pe hârtie sau chiar procesarea lui electronic. Cu cât sunt mai multe elemente descriptive, cu atât mai multe părți ale documentului pot fi identificate. Încă din primele zile ale marcajului, unul dintre avantajele sale a fost că, în cazul pierderii unui sistem informatic, imprimarea date rămâne totuși lizibilă datorită etichetelor.

    Limbajele de marcare au trecut de la primele forme create de companii și agenții guvernamentale la Standard Generalized Markup Language (SGML), Hypertext Markup Language (HTML) și, eventual, la XML. SGML ar putea părea complicat, iar HTML (care era practic doar o colecție de elemente la început) nu era suficient de puternic pentru a identifica informațiile. XML a fost conceput ca un limbaj de marcare ușor de utilizat și extensibil.

    În XML, vă puteți crea propriile elemente, ceea ce vă permite să reprezentați cu exactitate bucăți de date. Documentele nu pot fi împărțite doar în paragrafe și titluri, ci și pot selecta orice fragmente din document. Pentru a fi eficient, trebuie să definiți o listă finită a elementelor dvs. și să vă respectați. Elementele pot fi definite într-o definiție a tipului de document (DTD) sau într-o schemă, care va fi discutată pe scurt mai jos. Odată ce ați stăpânit și ați început să utilizați XML, nu vă fie teamă să experimentați cu nume de elemente în timp ce creați fișiere reale.

    Construirea unui document XML

    După cum sa menționat, fișierele XML sunt alcătuite din text și markup. Majoritatea textului este plasat în elemente în care textul este înconjurat de etichete. De exemplu, să presupunem că doriți să creați o carte de bucate în format XML. Avem o rețetă numită Sundae cu înghețată Pentru a fi convertit în XML. Pentru a marca numele rețetei, includem textul acesteia într-un element care începe și se termină cu etichete. Acest element poate fi numit recipename . Pentru a marca eticheta de început a unui element, puneți numele acestuia între paranteze unghiulare<>), ca aceasta: . Apoi introduceți textul Ice Cream Sundae . După text, puneți o etichetă de final, care este numele elementului între paranteze unghiulare, plus un element care se termină oblică (/) în fața numelui elementului, astfel:. Aceste etichete se formează element, în care puteți introduce text și chiar alte elemente.

    Numele elementelor pot fi create atât pentru documente individuale, cât și pentru grupuri de documente. În funcție de cerințele dumneavoastră, puteți specifica regulile care trebuie respectate pentru elemente. Elementele pot fi strict specifice sau destul de generale. Regulile trebuie, de asemenea, să definească ceea ce este permis să fie inclus în fiecare element. Ele pot fi stricte, libere sau intermediare. Pur și simplu creați elemente care definesc părțile documentului pe care le considerați importante.

    Începeți să creați fișierul XML

    Prima linie a unui document XML poate fi o declarație XML. Această parte opțională a fișierului îl definește ca un fișier XML, care poate ajuta instrumentele automate și oamenii să recunoască fișierul ca XML, mai degrabă decât ca SGML sau alte markupuri.

    Declarația ar putea arăta exact ca sau includeți versiunea XML ( ) și chiar codificarea caracterelor, de exemplu,pentru Unicode. Deoarece această declarație trebuie să fie la începutul fișierului, dacă intenționați să combinați fișiere XML mici într-un fișier mai mare, acest element opțional este cel mai bine omis.

    Crearea elementului rădăcină

    Etichetele de început și de sfârșit ale elementului rădăcină înconjoară întregul corp al documentului XML. Trebuie să existe un singur element rădăcină în fișier și acesta este „skin” necesar pentru acesta. arată un fragment din exemplul pe care îl folosesc aici cu elementul rădăcină (reţetă). (Fișierul XML complet este în .)

    Lista 1. Element rădăcină

    Pe măsură ce creați documentul, veți plasa text și etichete suplimentare între acestea și .

    Numele elementelor

    Sensibilitatea majusculelor în etichete

    Când se creează XML, cazul etichetelor de început și de sfârșit trebuie să se potrivească. În caz contrar, este posibil să primiți o eroare când utilizați sau vizualizați XML. De exemplu, Internet Explorer nu afișează text dacă există o nepotrivire între majuscule și litere. În schimb, afișează mesaje despre o nepotrivire între etichetele de început și de sfârșit.

    Deci avem un element rădăcină . În XML, numele elementelor sunt selectate mai întâi, iar apoi DTD-ul sau schema corespunzătoare este determinată pe baza acestor nume. Numele pot conține litere, cifre și caractere speciale, cum ar fi liniuța de subliniere (_). Iată câteva reguli de denumire de reținut:

    • Spațiile în numele elementelor nu sunt permise.
    • Numele trebuie să înceapă cu o literă, nu cu un număr sau cu semn. (După această primă literă, poate fi utilizată orice combinație de litere, cifre și caractere valide.)
    • Cazul nu contează, dar aveți grijă să evitați confuzia.
    Lista 2. Alte elemente
    Sundae cu înghețată 5 minute

    Un document XML poate conține etichete goale care nu au nimic în interior și pot fi exprimate ca o singură etichetă, mai degrabă decât o pereche de etichete de început și de sfârșit. De exemplu, ar putea fi o etichetă de stil HTML independentă . Nu conține niciun element copil sau text, deci este un element gol și poate fi scris ca (cu un spațiu și familiarul slash final).

    Elemente de cuibărit

    Atașamentul este plasarea elementelor în interiorul altor elemente. Aceste elemente noi sunt numite filiale elemente, iar elementele care le înconjoară – lor părintească elemente. În elementul rădăcină imbricate mai multe articole. Acestea sunt elemente copil imbricate , și În interiorul unui element există mai multe elemente copil identice . Imbricarea poate face un document XML la mai multe niveluri.

    O eroare de sintaxă tipică este legată de imbricarea părinte și copil. Fiecare element copil trebuie plasat în întregime între etichetele de început și de sfârșit ale elementului său părinte. Elementele copil trebuie să se termine înainte de începutul următorului element copil.

    Un exemplu de imbricare corectă este dat în . Etichetele încep și se termină fără ţese cu alte etichete.

    Lista 3. Imbricarea corectă a elementelor XML.
    Sundae cu înghețată 3 sirop de ciocolată sau fudge de ciocolată 1 nuci 1 cireașă 5 minute

    Adăugarea de atribute

    Elementele sunt uneori adăugate Atribute. Atributele constau dintr-o pereche nume-valoare, unde valoarea este luată între ghilimele duble ("), astfel: tip="desert" . Atributele vă permit să salvați parametri suplimentari împreună cu elementul, schimbând valorile \u200b\ u200din acești parametri de la element la element din același document .

    Un atribut – sau chiar mai multe atribute – este specificat în interiorul etichetei de început a unui element: . Când adăugați mai multe atribute, acestea sunt separate prin spații: . arată fișierul XML așa cum arată acum.

    Lista 4. Fișierul nostru XML cu elemente și atribute
    Sundae cu înghețată 5 minute

    Puteți utiliza orice număr de atribute. Gândiți-vă la ce detalii puteți adăuga documentului dvs. Atributele sunt utile în special dacă documentele vor fi stocate - de exemplu, după tipul de rețetă. Numele atributelor pot conține aceleași caractere ca și numele elementelor, cu aceleași reguli pentru excluderea spațiilor și pentru începutul numelor cu o literă.

    XML bine format și malformat

    Dacă urmați regulile definite în structura dvs., veți putea crea cu ușurință cod XML bine format. XML corect este un cod XML compilat conform tuturor regulilor XML: denumirea corectă a elementelor, imbricarea, denumirea atributelor și așa mai departe.

    În funcție de ceea ce faceți cu XML, poate fi necesar să lucrați cu XML bine format. Luați în considerare exemplul de mai sus de sortare după tipul de rețetă. Este necesar ca elementele conținea un atribut tip. Este foarte important să puteți testa cu succes codul și să vă asigurați că valoarea acestui atribut este întotdeauna prezentă.

    În curs de validare se înțelege ca verificarea structurii documentului pentru respectarea regulilor stabilite pentru acesta și determinarea elementelor fiu pentru fiecare element părinte. Aceste reguli sunt definite în Descrierea tipului de document(DTD) sau schema. Această validare necesită să creați un DTD sau o schemă și apoi să faceți referire la fișierul DTD sau schema din fișierele dvs. XML.

    Pentru a activa validarea, trebuie să plasați o declarație de tip de document (DOCTYPE) aproape de începutul documentelor XML. Acest șir conține o referință la DTD sau schema (lista de elemente și reguli) care va fi folosită pentru validarea acestui document. Șirul DOCTYPE poate fi ceva ca în .

    Lista 5. DOCTYPE

    Acest exemplu înseamnă că fișierul cu lista de articole este numit nume de fișier.dtd rezidă pe computerul dvs. (adică în directorul SYSTEM, nu în directorul public PUBLIC).

    Utilizarea entităților

    Entități pot fi fragmente de text sau caractere speciale. Ele pot fi specificate în interiorul documentului sau în afara acestuia. Entitățile trebuie să fie declarate și exprimate corespunzător pentru a evita erorile și pentru a se afișa corespunzător.

    Nu puteți introduce caractere speciale direct în text. Pentru a folosi caractere speciale în text, trebuie să le faci entități și să folosești codurile acestor caractere. Puteți defini expresii ca entități, cum ar fi numele unei companii, și apoi le puteți utiliza pe tot parcursul textului. Pentru a crea o entitate, dați-i un nume și inserați acel nume și inserați acel nume în text după un ampersand (&) și se termină cu punct și virgulă - de exemplu, (sau alt nume). Apoi includeți acest cod în șirul dvs. DOCTYPE între paranteze drepte(), ca în . Acest cod definește textul care este înlocuit pentru entitate.

    Lista 6. Entitate

    Utilizarea entităților ajută la evitarea repetării repetate a aceleiași fraze sau informații. De asemenea, poate facilita editarea textului (de exemplu, dacă o companie își schimbă numele) în mai multe locuri simultan, prin simpla modificare a șirului de definire a entității.

    Cum să evitați greșelile

    În timp ce învățați cum să creați fișiere XML, deschideți-le într-un editor XML pentru a vă asigura că sunt corecte din punct de vedere formal și pentru a vă asigura că regulile XML sunt respectate. De exemplu, dacă aveți Windows® Internet Explorer®, puteți pur și simplu să deschideți fișierul XML într-un browser. Dacă elementele, atributele și textul dvs. sunt afișate, atunci fișierul XML este bine format. Dacă există erori, probabil că ați greșit ceva în sintaxă și trebuie să verificați cu atenție documentul pentru greșeli de scriere sau etichete și semne de punctuație lipsă.

    Concluzie

    Învățând câteva reguli simple, aveți flexibilitatea de a vă crea propriile elemente XML și atributele acestora. Regulile XML nu sunt complicate. Tastarea unui document XML este, de asemenea, ușoară. Cheia este să înțelegeți ce doriți de la documente în ceea ce privește capabilitățile de sortare și căutare, apoi să proiectați elemente și atribute pentru a îndeplini aceste cerințe.

    Când înțelegeți bine scopul și știți cum să marcați textul, puteți crea elemente și atribute eficiente. Din acest punct de vedere, marcarea atentă este tot ceea ce este necesar pentru a crea un document XML bine format și utilizabil.

    Destul de des, mulți utilizatori ai sistemelor informatice moderne și ai produselor software de diferite tipuri dau peste fișiere care au extensia .xml. Mulți pur și simplu nu își imaginează ce fel de document este, cum să-l deschidă. Acum se va lua în considerare, În același timp, vom afla ce este și pentru ce este.

    Ce este un fișier XML

    Să începem cu faptul că, din punctul de vedere al tehnologiilor informatice moderne și al programelor folosite pentru a crea documente de acest tip, este un fișier text în care sunt scrise comenzile Universal Extensible Markup Language, care seamănă destul de mult cu bine -cunoscut instrument de marcare HTML.

    De regulă, un fișier XML conține informații generale despre un obiect, care sunt exprimate în mijloace descriptive (mai multe despre asta mai târziu). În ceea ce privește datele stocate în astfel de containere, pot fi baze de date folosite adesea pentru cataloage video și audio pe Internet, setări de utilizator salvate pentru programe și aplicații, precum și pagini web întregi.

    Ca exemplu, puteți lua, să zicem, un album audio al unui artist. Fișierul XML include informații despre anul lansării, genul, numărul și titlurile pieselor, popularitate etc. Adevărat, atunci când vizitează resurse de pe World Wide Web, navigatorul nu trebuie să se gândească la deschiderea fizică a unui astfel de fișier de informații, deoarece chiar și atunci când redați o melodie online în player vor fi afișate toate datele de tipul conținute în fișierele MP3 standard sub formă de etichete ID3. Informațiile sunt, parcă, încărcate pe piesa redată.

    Un fel de fișier XML

    Dacă vă uitați la vizualizarea fișierului, puteți observa imediat că proprietățile oricărui obiect sunt descrise în acesta folosind etichete și atribute care sunt setate manual.

    Nu vorbim acum despre principalele comenzi ale limbajului în sine, deoarece utilizatorul obișnuit nu are nevoie de astfel de informații. Singurul lucru care poate fi remarcat este că nu există un anumit număr de elemente folosite pentru a descrie un obiect în acest format: câte aveți nevoie, câte sunt setate.

    Cum se deschide formatul XML standard

    Acum să vedem cum să deschidem fișierul XML. După cum probabil mulți au înțeles deja, acesta este un fișier text, ceea ce înseamnă că este cel mai ușor să utilizați oricare, chiar și cel mai primitiv editor, pentru a-l vizualiza sau edita. Da, chiar și același „Notepad” din setul standard de Windows.

    Cu toate acestea, nu totul este atât de simplu aici. Faptul este că făcând dublu clic pe un fișier fără a seta asocierea corespunzătoare cu niciun program nu se va deschide. În cel mai bun caz, sistemul va oferi o listă cu cele mai potrivite aplicații. Puteți selecta programul la alegere și, în același timp, bifați caseta de lângă opțiunea de a utiliza permanent aplicația selectată pentru toate fișierele de acest tip.

    Puteți face altfel făcând clic dreapta pe fișier și apoi selectând comanda „Deschide cu...”, după care, din nou, selectați aplicația dorită fie din listă, fie specificați locația componentei executabile principale (cel mai des acesta este un fișier EXE).

    A treia modalitate de a deschide un fișier XML este să lansați inițial programul și apoi să utilizați meniul de deschidere a fișierului (în cele mai multe cazuri, acesta este Ctrl + O). În acest caz, nu este necesar să utilizați Notepad. Vă rog, fișierul se deschide fără probleme în aceeași aplicație Word și altele asemenea. Chiar și „Microsoft” Excel este capabil să deschidă date din acest format.

    Cu toate acestea, dacă devine necesară editarea formatului XML, atunci este mai bine să utilizați utilități profesionale cu suport pentru sintaxă a limbii, de exemplu, Oxygen XML Editor, XML Marker sau EditiX Lite Version. Desigur, acestea nu sunt toate utilitarele capabile să lucreze cu limba fișierului la cel mai înalt nivel. Există multe astfel de programe astăzi.

    Acum câteva cuvinte despre motivul pentru care apare uneori o eroare de fișier XML la deschidere. Cel mai adesea, acest lucru se datorează unei încălcări a integrității fișierului în sine, precum și introducerii incorecte a atributelor sau etichetelor descriptive. În plus, Excel are o limită a rândurilor care pot fi afișate, așa că în acest caz, este posibil ca datele să nu fie complete la deschidere.

    Posibile erori la deschiderea unui fișier XML ca atașament de e-mail

    Uneori pot apărea erori atunci când se încearcă deschiderea unui fișier care este atașat la un mesaj de e-mail. Cel mai mult, acest lucru se aplică clienților de e-mail standard precum Outlook Express.

    Faptul este că la început atașamentul este salvat ca date temporare (foarte des cu adăugarea unei extensii suplimentare .tmp la extensia principală) și este accesat exact la acesta.

    Pentru a evita această situație, este suficient să salvați inițial atașamentul în formatul original în orice loc convenabil de pe disc sau pe un suport amovibil și apoi să utilizați metodele standard descrise mai sus.

    În loc de total

    După cum puteți vedea, nu este nimic dificil să înțelegeți structura și modalitățile de deschidere a fișierelor cu acest format. Aici, însă, problema creării datelor XML nu a fost luată în considerare în mod fundamental, deoarece pentru a înțelege pe deplin procesul, trebuie să cunoașteți cel puțin elementele de bază ale limbajului în sine. În caz contrar, se pare că utilizatorii nu vor avea dificultăți cu fișierele de acest format.

  • Serghei Savenkov

    un fel de recenzie „rare”... parcă s-ar grăbi undeva