अंतिम अपडेट: 21 May, 2025

शीर्षक - XML क्या है: एक व्यापक गाइड

XML क्या है?

XML (विस्तार योग्य मार्कअप भाषा) एक मार्कअप भाषा और फ़ाइल फ़ॉर्मेट है जिसका उपयोग डेटा को संग्रहित करने, प्रसारित करने और पुनर्निर्मित करने के लिए किया जाता है। यह जानकारी को एन्कोड करने के लिए एक संरचित दृष्टिकोण प्रदान करता है, जिससे यह मानव-पठनीय और मशीन-पठनीय दोनों बनता है।

XML की प्रमुख विशेषताएँ

1. ओपन मानकों द्वारा परिभाषित

  • World Wide Web Consortium (W3C) द्वारा 1998 में XML 1.0 Specification के तहत स्थापित किया गया।
  • डेटा को संरचित और आसानी से व्याख्यायित करने के लिए सख्त नियमों का पालन करता है।

2. डिज़ाइन लक्ष्य

  • XML को विभिन्न प्लेटफ़ॉर्म पर सरलता, सामान्यता, और उपयोगिता के साथ डिज़ाइन किया गया है।
  • यह पाठ-आधारित फ़ॉर्मेट का उपयोग करता है, जिससे इसे पढ़ना और संपादित करना आसान होता है।

3. यूनिकोड समर्थन

  • XML Unicode का समर्थन करता है, जिससे यह कई भाषाओं में पाठ को संग्रहीत और प्रक्रिया कर सकता है।

4. बहुमुखी प्रतिभा

  • प्रारंभ में दस्तावेज़ों के लिए बनाया गया, XML अब विभिन्न डोमेनों में डेटा प्रतिनिधित्व के लिए व्यापक रूप से उपयोग किया जाता है, जिसमें वेब सेवाएँ, API, और कॉन्फ़िगरेशन फ़ाइलें शामिल हैं।

5. स्कीमा और API

  • XML संरचनाओं को Document Type Definition (DTD), XML Schema (XSD), या Relax NG का उपयोग करके परिभाषित किया जा सकता है।
  • विभिन्न API, जैसे DOM (Document Object Model) और SAX (Simple API for XML), XML प्रोसेसिंग को सक्षम बनाते हैं।

6. XML के सामान्य उपयोग

  • विभिन्न सिस्टमों के बीच डेटा विनिमय (जैसे, वेब सेवाएँ, API)।
  • सॉफ़्टवेयर अनुप्रयोगों में कॉन्फ़िगरेशन फ़ाइलें
  • संरचित जानकारी संग्रहीत करना (जैसे, RSS फ़ीड, SVG ग्राफ़िक्स, दस्तावेज़ फ़ॉर्मेट जैसे DOCX)।
  • वेब विकास (जैसे, XHTML, SOAP, AJAX-आधारित अनुप्रयोग)।

अब जब आप जानते हैं कि XML क्या है, तो इस शुरुआती-अनुकूल गाइड के साथ XML फ़ाइलें पढ़ने और संपादित करने के बारे में जानें।

XML अवलोकन

1. XML का मुख्य उद्देश्य: क्रमबद्धता (Serialization)

XML में क्रमबद्धता का अर्थ है:

  • डेटा संग्रहीत करना एक संरचित फ़ॉर्मेट में।
  • डेटा प्रसारित करना विभिन्न सिस्टमों के बीच।
  • डेटा पुनर्निर्माण उपयोगी रूप में।

जब दो सिस्टमों को जानकारी का आदान-प्रदान करना होता है, तो XML इंटरऑपरेबिलिटी के लिए एक मानकीकृत फ़ाइल फ़ॉर्मेट प्रदान करता है। यह संरचित डेटा विनिमय के लिए एक “lingua franca” के रूप में कार्य करता है।

2. XML एक मार्कअप भाषा के रूप में

XML एक मार्कअप भाषा है, जिसका अर्थ है कि यह:

  • स्पष्ट संरचना के लिए डेटा को टैग्स के साथ लेबल करता है
  • जानकारी को क्रमबद्ध रूप से व्यवस्थित करता है
  • डेटा को मेटाडेटा के साथ वर्गीकृत करता है

उदाहरण:

<book>
    <title>XML Basics</title>
    <author>John Doe</author>
</book>

यहाँ, <book>, <title>, और <author> टैग हैं जो डेटा तत्वों को परिभाषित करते हैं।

3. XML स्कीमा (XSD) और वैधता

एक XML स्कीमा (XSD) XML दस्तावेज़ों के लिए संरचनात्मक नियम निर्धारित करता है।

XML दस्तावेज़ सही-रूप हो सकते हैं → बुनियादी सिंटैक्स नियमों का पालन करता है (सही नेस्टिंग, उचित बंद टैग)।
XML दस्तावेज़ वैध हो सकते हैं → स्कीमा नियमों के अनुरूप है (अनिवार्य तत्व, सही डेटा प्रकार)।

XSD नियम का उदाहरण:

<xs:element name="title" type="xs:string"/>

यह सुनिश्चित करता है कि <title> को एक स्ट्रिंग मान होना चाहिए।

4. XML मीडिया प्रकार (RFC 7303)

IETF RFC 7303 डेटा प्रसारण के लिए XML मीडिया प्रकार निर्धारित करता है:

  • application/xml → मानक XML डेटा।
  • application/xml-external-parsed-entity → पार्स्ड XML एंटिटी।
  • application/xml-dtd → XML DTD दस्तावेज़।

XML-आधारित फ़ॉर्मेट के लिए, +xml उपसर्ग का उपयोग किया जाता है (जैसे, [SVG][3] छवियों के लिए image/svg+xml)।

5. नेटवर्केड अनुप्रयोगों में XML (RFC 3470 / IETF BCP 70)

IETF BCP 70 (RFC 3470) नेटवर्क-आधारित अनुप्रयोगों में XML उपयोग के लिए सर्वोत्तम प्रथाओं को रेखांकित करता है, जिससे सिस्टमों के बीच सहज डेटा इंटरऑपरेबिलिटी सुनिश्चित होती है।

XML के साथ प्रोग्रामेटिक रूप से काम करने के लिए, Python, Java, और JavaScript के लिए सर्वश्रेष्ठ XML पार्सर देखें।

1. XML के अनुप्रयोग

XML एक लचीली मार्कअप भाषा है जो इंटरनेट पर डेटा विनिमय के लिए डिज़ाइन की गई है। इसकी सिंटैक्स ने कई दस्तावेज़ फ़ॉर्मेट और संचार प्रोटोकॉल को प्रभावित किया है, जिससे यह कई उद्योगों में एक बुनियादी तकनीक बन गई है।

सामान्य XML-आधारित फ़ॉर्मेट:

  • वेब फ़ीड: RSS, Atom
  • ऑफ़िस दस्तावेज़: Office Open XML, OpenDocument
  • ग्राफ़िक्स और 3D मॉडल: SVG, COLLADA
  • वेब तकनीकें: XHTML
  • डेटा विनिमय प्रोटोकॉल: SOAP, XMPP
  • AJAX: असिंक्रोनस डेटा विनिमय के लिए XML का उपयोग करता है

XML का उपयोग करने वाले उद्योग मानक:

  • स्वास्थ्य देखभाल: HL7 (Health Level 7)
  • यात्रा उद्योग: OpenTravel Alliance
  • वित्त: FpML (Financial products Markup Language)
  • रियल एस्टेट और मॉर्टगेज: MISMO
  • सरकारी डेटा विनिमय: National Information Exchange Model

विज्ञान में XML:

मौसम विज्ञान में, XML का उपयोग ऑपरेशनल मौसम डेटा प्रतिनिधित्व के लिए IWXXM मानकों के अनुसार किया जाता है। इसी तरह, Darwin Information Typing Architecture (DITA) एक XML मानक है जो प्रकाशन में व्यापक रूप से उपयोग किया जाता है।

व्यावहारिक कार्यान्वयन के लिए, हमारे ट्यूटोरियल को देखें: Python, Java, और JavaScript में XML को पढ़ने और संपादित करने के बारे में

2. XML में मुख्य शब्दावली

XML में मुख्य शब्दावली को समझना XML दस्तावेज़ों के साथ प्रभावी रूप से काम करने के लिए महत्वपूर्ण है।

अक्षर

एक XML दस्तावेज़ Unicode अक्षरों की श्रृंखला है। XML 1.1 लगभग सभी Unicode अक्षरों की अनुमति देता है, सिवाय नल अक्षर (U+0000) के, जिसे सख्ती से प्रतिबंधित किया गया है।

प्रोसेसर और अनुप्रयोग

  • XML प्रोसेसर (या पार्सर) XML मार्कअप को पढ़ता और विश्लेषण करता है।
  • अनुप्रयोग प्रोसेसर से संरचित डेटा प्राप्त करता है और उस पर कार्य करता है।

मार्कअप और सामग्री

XML अक्षरों को मार्कअप और सामग्री में विभाजित करता है:

  • मार्कअप: तत्व, गुण, और एंटिटी शामिल हैं (जैसे, <tag> और &amp;)।
  • सामग्री: तत्वों के भीतर वास्तविक डेटा।
  • CDATA सेक्शन: वह पाठ जो मार्कअप के रूप में पार्स नहीं होना चाहिए, <![CDATA[ ... ]]> के भीतर संलग्न।

टैग और तत्व

  • टैग: < > में संलग्न मार्कअप निर्माण।
    • <section> (प्रारंभिक टैग)
    • </section> (समाप्ति टैग)
    • <line-break /> (खाली-तत्व टैग)
  • तत्व: टैग द्वारा परिभाषित तार्किक घटक।
    • उदाहरण: <greeting>Hello, world!</greeting>

गुण

गुण नाम-मूल्य जोड़े का उपयोग करके तत्वों के लिए मेटाडेटा प्रदान करते हैं। उदाहरण:

<img src="image.jpg" alt="Description" />

src="image.jpg" और alt="Description" <img> तत्व के गुण हैं।

3. XML में अक्षर और एस्केपिंग

XML में मान्य Unicode अक्षर

XML दस्तावेज़ सही पार्सिंग सुनिश्चित करने के लिए केवल विशिष्ट Unicode अक्षरों की अनुमति देते हैं।

XML 1.0 में अनुमत अक्षर:

  • नियंत्रण अक्षर:
    • U+0009 (टैब)
    • U+000A (लाइन फ़ीड)
    • U+000D (कैरेज रिटर्न)
  • पाठ अक्षर:
    • U+0020–U+D7FF
    • U+E000–U+FFFD
    • U+10000–U+10FFFF

XML 1.1 सुधार:

  • सभी U+0001–U+001F नियंत्रण अक्षरों की अनुमति देता है, लेकिन उन्हें एस्केप करना आवश्यक है।
  • U+0000 (नल अक्षर) अभी भी प्रतिबंधित है।

4. XML में एन्कोडिंग

सामान्य XML एन्कोडिंग:

XML Unicode-आधारित एन्कोडिंग का समर्थन करता है, जिसमें शामिल हैं:

  • UTF-8 (सिफ़ारिश किया गया डिफ़ॉल्ट)
  • UTF-16 (सभी XML पार्सर द्वारा समर्थित होना चाहिए)
  • ASCII, ISO-8859-X (पुरानी एन्कोडिंग)

XML में एन्कोडिंग घोषणा:

XML हेडर एन्कोडिंग निर्दिष्ट कर सकता है:

<?xml version="1.0" encoding="UTF-8"?>
  • यदि कोई एन्कोडिंग निर्दिष्ट नहीं है, तो UTF-8 माना जाता है
  • UTF-16 को सही पहचान के लिए BOM (बाइट ऑर्डर मार्क) की आवश्यकता होती है।

5. XML में विशेष अक्षरों का एस्केपिंग

चूंकि XML सिंटैक्स कुछ अक्षरों को आरक्षित करता है, उन्हें टकराव से बचने के लिए एस्केप करना आवश्यक है।

पूर्वनिर्धारित XML एंटिटीज़:

अक्षरएस्केप रूपउदाहरण
< (से कम)&lt;I &lt;3 XMLI <3 XML
> (से अधिक)&gt;x &gt; yx > y
& (ऐम्परसैंड)&amp;AT&amp;TAT&T
' (एकल उद्धरण)&apos;"O&apos;Reilly"O’Reilly
" (डबल उद्धरण)&quot;She said &quot;hello&quot;She said “hello”

संख्यात्मक अक्षर संदर्भ:

ऐसे विशेष अक्षरों के लिए जो टाइप नहीं किए जा सकते, संख्यात्मक संदर्भों का उपयोग करें:

  • दशमलव:
    &#20013;  <!-- Chinese character "中" -->
    
  • हेक्साडेसिमल:
    &#x4E2D;  <!-- Chinese character "中" -->
    
  • उदाहरण:
    <message>I &lt;3 J&#xF6;rg</message>
    
    Displays as: I <3 Jörg

बाइनरी डेटा का प्रबंधन:

XML कच्चे बाइनरी डेटा का समर्थन नहीं करता है। इसके बजाय, Base64 एन्कोडिंग का उपयोग करें।

6. XML में टिप्पणी

XML टिप्पणी सिंटैक्स:

<!-- This is a valid XML comment -->

XML टिप्पणियों के नियम:

  • XML घोषणा से पहले नहीं आ सकता
  • टिप्पणी के भीतर -- (डबल हाइफ़न) नहीं हो सकता।
  • टिप्पणी में एंटिटी रेफ़रेंसेज़ को अनदेखा किया जाता है।

उदाहरण:

<!-- This is a comment with < and & symbols -->

निष्कर्ष

XML एक आवश्यक तकनीक है जो वेब फ़ीड, ऑफिस दस्तावेज़, वैज्ञानिक डेटा, और उद्योग मानकों को संरचित डेटा विनिमय के लिए शक्ति प्रदान करती है। मुख्य XML शब्दावली, एन्कोडिंग नियम, और एस्केपिंग तंत्र को समझने से सही‑रूप XML दस्तावेज़ बनते हैं जो विभिन्न सिस्टमों में सही ढंग से कार्य करते हैं।

अक्षर एन्कोडिंग और एस्केपिंग में सर्वोत्तम प्रथाओं का पालन करके, डेवलपर पार्सिंग त्रुटियों से बच सकते हैं और XML‑आधारित अनुप्रयोगों में संगतता सुनिश्चित कर सकते हैं