Polskie tłumaczenie Rekomendacji "XML Information Set (Second Edition)"

Autor: Mariusz Żebrowski.
Lokalizacja: http://www.antyspam.pl/w3c/REC-xml-infoset-20040204/

Dokument ten jest tłumaczeniem rekomendacji XML Information Set (Second Edition). Przekład ten nie jest przekładem normatywnym i może zawierać błędy wynikające z tłumaczenia. Status normatywny posiada jedynie wersja angielskojęzyczna na stronie W3C http://www.w3.org/TR/2004/REC-xml-infoset-20040204/.
Dokument jest chroniony prawem autorskim. Copyright © 2004 W3C® (MIT, ERCIM, Keio).

W3C

Zbiór Informacyjny XML (Wydanie Drugie)

W3C Rekomendacje z 4 Lutego 2004

Obecna wersja:
http://www.w3.org/TR/2004/REC-xml-infoset-20040204
Najnowsza wersja:
http://www.w3.org/TR/xml-infoset
Poprzednia wersja:
http://www.w3.org/TR/2003/PER-xml-infoset-20031210
Edytorzy:
John Cowan, jcowan@reutershealth.com
Richard Tobin, richard@cogsci.ed.ac.uk

Proszę zobaczyć erratę dla tego dokumentu, która może zawierać pewne normatywne poprawki.

Zobacz także tłumaczenia.


Streszczenie

Ta specyfikacja oferuje zestaw definicji dla użycia w innych specyfikacjach, które potrzebują odnosić się do informacji w dokumencie XML.

Status Dokumentu

Ten paragraf opisuje status tego dokumentu od czasukiedy jest opublikowany. Inne dokumenty mogą zastąpić ten dokument. Lista bieżących publikacji W3C i najnowszą weryfikację tego raportu technicznego można zanaleźć na W3C technical reports index na http://www.w3.org/TR/.

Ten dokument jest Rekomendowany przez W3C. Został on zbadany przez członków W3C i inne strony zainteresowane oraz zatwierdzony przez dyrektora jako Rekomendacja W3C. To jest dokument stabilny i może być używany jako materiał odniesienia lub cytowany jako odniesienie normatywne z innego dokumentu. Zadaniem W3C w wydaniu tej rekomendacji jest przyciągnięcie uwagi do tej specyfikacji i promowanie jej szerokiego zastosowania. Wzbogaci to funkcjonalność i interoperacyjność sieci Web.

Ten dokument uaktualnia Infoset będąc nakładką na wersję XML 1.1 i przestrzeń nazw 1.1, wyjaśnia konsekwencje pewnych rodzajów niepoprawności składniowej i poprawiania pewnych błędów typograficznych. To jest produkt W3C XML Activity. Tylko angielska wersja specyfikacji jest wersją normatywną. Jednakże, szukając tłumaczeń tego dokumentu zobacz http://www.w3.org/2003/03/Translations/byTechnology?technology=xml-infoset.

Documentacja z intelektualną właściwością może odnosić się do tych rekomendacji może być znaleziona na publicznej stronie Working Group IPR disclosure page.

Prosimy zgłaszać błędy w tym dokumencie na adres www-xml-infoset-comments@w3.org (publiczne archiwa są  dostępne). Lista erraty dla tej rekomendacji jest dostępna na http://www.w3.org/2001/10/02/xml-infoset-errata.html.

Spis treści


1. Wprowadzenie

Ta specyfikacja definiuje abstrakcyjny zbiór danych Zbiór informacyjny XML (ang. XML Information Set (Infoset)). Jego celem jest dostarczanie spójnego zbioru definicji do wykorzystania w innych specyfikacjach, które potrzebują odnosić się do informacji w poprawnie składniowo uformowanym dokumencie XML [XML].

Celem jej nie jest bycie wyczerpującą; Głównym kryterium przy doborze przedmiotów informacyjnych albo właściwości jest spodziewana użyteczność w przyszłych specyfikacjach. Także nie stanowi zestawu minimum informacji, które muszą być zwracane przez procesor XML.

Dokument XML posiada zbiór informacyjny jeżeli jest poprawnie sformułowany i zachowuje ograniczenia przestrzeni nazw opisane w below. Aby dokument XML posiadał zbiór informacyjny nie jest wymagane aby był poprawny składniowo.

Zbiory informacyjne mogą być tworzone przez inne metody (nie opisane w tej specyfikacji) inne niż analiza gramatycza dokumentu XML. Patrz Synthetic Infosets poniżej.

Zbiór informacyjny dokumentu XML składa się z pewnej liczby przedmiotów / elementów informacyjnych; zbiów informacyjnych dla każdego poprawnie sformułowanego dokumentu XML będzie zawierał conajmniej przedmiot / element informacyjny document oraz kilka innych. Przedmiot informacyjny jest abstrakcyjnym opisem pewnej częci dokumentu XML; każdy element informacyjny posiada związany z nim zbiór nazwanych właściwości. W tej specyfikacji nazwy właściwości są przedstawione w nawiasach kwadratowych, [thus]. Typy przedmiotów informacyjny są wymienione w section 2.

Zbiór informacyjny XML nie wymaga lub preferuje szczególnego interfejsu lub klasy interfejsów. Ze względu na jasność i prostotę, ta specyfikacja przedstawia zbiór informacyjny jako zmodyfikowane drzewo, jednakże nie jest wymagane aby Zbiór Informacyjny XML był dostępny jako struktura drzewiasta; możliwe są inne typy interfejsów między innymi oparte na zdarzeniach i zapytaniach w celu dostarczania informacji w sposób zgodny z Zbiorem Informacyjnym XML.

Terminy "zbiór informacyjny" i "przedmiot / element informacyjny" są podobnie rozumiane jak powszechnie używane w informatyce terminy "drzewo" i "węzeł". Jednakże w tej specyfikacji używane są pierwsze z tych określeń w celu ograniczenia możliwości pomyłki z innymi modelami danych. Elementy informacyjne nie przekładają się jeden-do-jeden na węzły DOM lub "drzewa" i "węzły" modelu danych XPath.

W tej specyfikacji zakłada się znaczenie słów "musi", "powinien" i "może" zgodnie z [RFC2119], z takim wyjątkiem że słowa te nie są przedstawione kapitalikiem.

Wersje XML

Różne wersje specyfikacji XML mogą przedstawiać równe reguły analizy. Zbiór informacyjny dokumentu XML jest zdefiniowany aby był jedynym otrzymanym poprzez jego analizę zgodnie z regułami specyfikacji, której wersja odpowiada wersji z dokumentu. Dokument który nie specyfikuje numeru wersji jest uważany za dokument w wersji 1.0. Jeśli procesor XML akceptuje dokument z numerem wersji, której nie zna, niekoniecznie oznacza to że bedzie w stanie utworzyć poprawny zbiór informacyjny.

Przestrzenie nazw

XML dokumenty, które nie są zgodne z [Przestrzeniami nazw], chociaż są technicznie dobrze ukształtowane, nie są uważane za posiadające znaczące zbiory informacji. To znaczy, że ta specyfikacja nie określa zbiorów informacji dla dokumentów, które posiadają nazwy elementu, lub atrybutu zawierające dwukropki, które są używane w inny sposób, niż zalecany przez [Przestrzenie nazw].

W dodatku, ta specyfikacja nie określa zbioru informacji dla dokumentów, które używają względnych odnośników URI w deklaracjach przestrzeni nazw. Jest to zgodne z decyzją Plenarnej Grupy Interesu W3C XML opisanej we [Względnych Odnośnikach Przestrzeni Nazw URI].

Wartością własności [namespace name] (nazwa przestrzeni nazw) jest znormalizowana wartość odpowiadającego atrybutu przestrzeni nazw; żaden dodatkowy uwalniany URI nie odnosi się do tego przez procesor.

Elementy rekordu

Zbiór informacji opisuje jego dokument XML z już rozszerzonymi odnośnikami elementów rekordu, tj. przedstawiany przez elementy informacyjne odpowiadające tekstowi, który jest na ich miejscu. Jednak są różne okoliczności, w których procesor może nie wykonać tego rozszerzenia. Element rekordu może nie być zdeklarowany, lub może nie być możliwy do odzyskania. Procesor niewalidujący może wybrać nie czytać wszystkich deklaracji, a nawet jeśli nie, może rozszerzyć wszystkie zewnętrzne elementy rekordu. W takich przypadkach element infomacyjny nierozszerzonego odnośnika elementu rekordu jest używany do przedstawiania odnośnika elementu rekordu.

Obsługiwanie końca wiersza

Wartości wszystkich własności w Zbiorze informacji biorą pod uwagę normalizację końca wiersza opisaną w [XML], 2.11 "Obsługiwanie końca wiersza".

Podstawowe URI

Niektóre elementy informacyjne posiadają własności [base URI] (podstawowy URI) lub [declaration base URI] (deklaracja podstawowego URI). Są one wyliczone zgodnie z [Podstawą XML]. Zauważ, że odzyskanie źródła może zawierać przekierowanie na poziom analizatora skłądni (np. w przeliczniku elementu rekordu) lub niżej; w tym przypadku podstawowy URI jest końcowym URI używanym do odzyskania źródła po wszystkich przekierowaniach.

Wartość tych własności nie odzwierciedla żadnego uwalnianego URI, co może być wymagane do odzyskania źródła, ale może zawierać uwalniane znaki, jeżeli były określone w dokumencie, lub oddane przez serwer w celu przekierowania.

W niektórych przypadkach (takich jak czytanie dokumentów z łańcucha znaków lub potoku) zasady [Podstawy XML] mogą doprowadzać do podstawowego URI, który jest zależny od aplikacji. W takich przypadkach ta specyfikacja nie określa wartości własności [podstawowego URI] lub [deklaracji podstawowego URI].

Podczas rozwiązywania względnych własności URI [podstawowy URI] powinny być używane w preferencji do wartości atrybutów xml:base; mogą być sprzeczne w przypadku Syntetycznych Zbiorów Informacji.

``Nieznany '' i ``Brak wartości''

Niektóre własności mogą czasem posiadać wartości nieznany lub brak wartości, i powiedziano, że wartość własności jest nieznana, lub że własność odpowiednio nie posiada wartości. Te wartości różnią się od siebie i od wszystkich innych wartości. W szczególności różnią się od pustego ciągu znaków, pustego zbioru i pustej listy, każdy z których poprostu nie ma elementów. Ta specyfikacja nie używa terminu wartość zerowa ponieważ w niektórych społecznościach ma to szczególne znaczenie, co może nie pasować do tych przeznaczonych tutaj.

Niezgodności wynikające z nieważności

Jak zanotowano powyżej, dokument XML nie musi być ważny, aby posiadać zbiór informacji. Jednak pewne rodzaje nieważności wpływają na wartości przypisane pewnym własnościom. Elementy rekordu, zapisy, elementy i atrybuty mogą być niezdeklarowane. Zapisy i elementy mogą być wielokrotnie zdeklarowane (wielokrotne deklaracje są ważne dla elementów rekordu i atrybutów). ID może być niezdefiniowany lub wielokrotnie zdefiniowany. Takie przypadki są zauważane w stosownych miejscach, w poniższych definicjach Elementów Informacyjnych.

Syntetyczne Zbiory Informacji

Ta specyfikacja opisuje zbiór informacji wynikający z analizowania dokumentu XML. Zbiory informacji mogą być skonstruowane przy pomocy innych środków, na przykład przy użyciu API takich jak DOM lub przez przekształcanie istniejących zbiorów informacji.

Zbiór informacji odpowiadający prawdziwemu dokumentowi będzie koniecznie zgodny na wiele sposobów; np. własność [przestrzeni nazw in-scope] elementu będzie zgodna z własnościami [atrybutów przestrzeni nazw] elementu i jego przodków. To nie może być prawdziwe przy zbiorze informacji skonstruowanego innymi sposobami; w takim przypadku nie będzie żadnego dokumentu XML odpowiadającego zbiorowi informacji i aby dokonać jego serializacji będzie wymagać rozdzielenia niezgodności (np. przez uzyskanie deklaracji przestrzeni nazw, które odpowiadają przestrzeniom nazw w zakresie).

2. Przedmioty informacyjne

Zbiór informacji może zawierać do jedenastu różnych typów przedmiotów informacyjnych, jak wyjaśniono w następujących sekcjach. Każdy przedmiot informacyjny posiada właściwości. Dla ułatwienia odnoszenia, każda własność posiada nazwę, An information set can contain up to eleven different types of information item, as explained in the following sections. Every information item has properties. For ease of reference, each property is given a name, wskazaną [w ten sposób]. Odnośniki do definicji i/lub skłądni w Rekomendacji XML 1.0 [XML] są podane dla każdego przedmiotu informacyjnego.

2.1. Przedmioty informacyjne typu Dokument

Definicja XML: dokument (Część 2, Dokumenty)

Składnia XML: [1] Dokument (Część 2.1, Dobrze ukształtowane Dokumenty XML )

Jest dokładnie jeden przedmiot informacyjny typu dokument w zbiorze informacji i wszystkie inne przedmioty informacyjne są dostępne z właściwości przedmiotu informacyjnego typu dokument, zarówno bezpośrednio, jak i pośrednio poprzez właściwości innych przedmiotów informacyjnych.

Przedmiot informacyjny typu dokument posiada następujące właściwości:

  1. [potomek] Uporządkowana lista przedmiotów informacyjnych typu potomek, w kolejności dokumentu. Lista zawiera dokładnie jeden element przedmiotu informacyjnego. Lista zawiera również jedną instrukcję przetwarzania przedmiotu informacyjnego dla każdej instrukcji przetwarzania poza elementem dokumentu, oraz jeden komentarz przedmiotu informacyjnego dla każdego komentarza poza elementem dokumentu. Instrukcje przetwarzania i komentarze w obrębie DTD są wykluczone. Jeśli jest deklaracja typu dokumentu, lista także zawiera przedmiot informacyjny deklaracji typu dokumentu .
  2. [element dokumentu] Przedmiot informacyjny element odpowiadający elementowi dokumentu.
  3. [zapisy] Nieuporządkowany zbiór przedmiotów informacyjnych typu zapis, jeden dla każdego zapisu zdeklarowanego w DTD. Jeśli jakikolwiek zapis jest wielokrotnie zdeklarowany, ta własność nie ma wartości.
  4. [niezanalizowane elementy rekordu] Nieuporządkowany zbiór przedmiotów informacyjnych typu niezanalizowane elementy rekordu, jeden dla każdego niezanalizowanego elementu rekordu zdeklarowanego w DTD.
  5. [podstawowy URI] Podstawowy URI elementu rekordu dokumentu.
  6. [schemat kodowania znaków] Nazwa schematu kodowania znaków, w którym jest wyrażony element rekordu dokumentu.
  7. [samodzielny] Wskazanie statusu dokumentu na samodzielny, zarówno tak i nie. Ta własność jest uzyskana z opcjonalnej deklaracji samodzielnego dokumentu w deklaracji XML na początku elementu rekordu dokumentu i nie ma wartości, jeżeli nie ma deklaracji samodzielnego dokumentu.
  8. [wersja] Ciąg znaków przedstawiający wersję XML dokumentu. Ta właściwość jest uzyskana z deklaracji XML opcjonalnie obecnej na początku elementu rekordu dokumentu i nie ma wartości jeżeli nie ma deklaracji XML.
  9. [wszystkie deklaracje przetworzone] Ta właściwość, dokładnie mówiąc, nie jest częścią zbioru informacji dokumentu. Raczej jest wskazaniem, czy procesor odczytał kompletny DTD. Jego wartość jest logiczna. Jeżeli jest nieprawdziwa, wtedy pewne własności (wskazane w ich poniższych opisach) mogą nie być znane. Jeśli jest prawdziwa, te własności nigdy nie są nieznane.

2.2. Przedmioty informacyjne typu Element

Definicja XML: element (Część 3, Struktury Logiczne)

Składnia XML: [39] Element (Część 3, Struktury Logiczne)

Występuje przedmiot informacyjny typu element dla każdego elementu pojawiającego się w dokumencie XML. Jeden z przedmiotów informacyjnych typu element jest wartością własności [elementu dokumentu] przedmiotu informacyjnego typu dokument, odpowiadającego korzeniowi drzewa elementów i wszystkie inne elementy informacyjne typu element są dostępne porzez rekurencyjne występowanie po ich własnościach [potomków]:

  1. [nazwa przestrzeni nazw] Nazwa przestrzeni nazw, jeśli takowa jest, typu elementu. Jeżeli element nie należy do przestrzeni nazw, ta własność nie ma wartości.
  2. [nazwa lokalna] Lokalna część nazwy typu elementu. Nie zawiera to jakiegokolwiek prefiksu przestrzeni nazw lub następującego po nim dwukropka.
  3. [prefiks] Część prefiksu przestrzeni nazw nazwy typu elementu. Jeżeli nazwa nie posiada prefiksu, ta własność nie ma wartości. Zauważ, że aplikacje świadome przestrzeni nazw powinny używać przestrzeni nazw raczej niż prefiksu do identyfikacji elementów.
  4. [potomkowie] Uporządkowana lista przedmiotów informacyjnych typu potomek w porządku dokumentu. Ta lista zawiera element, instrukcję przetwarzania, nierozszerzalny odnośnik elementu rekordu , znak i przedmioty informacyjne typu komentarz, po jednym dla każdego elementu, instrukcji przetwarzania, odnośnika do nieprzetworzonego zewnętrznego elementu rekordu, znak danych oraz komantarz pojawiający się natychmiast wewnątrz bieżącego elementu. Jeżeli element jest pusty ta lista nie ma elementów.
  5. [atrybuty] Nieuporządkowany zbiór przedmiotów informacyjnych typu atrybut, jeden dla każdego z atrybutów (określony lub domyślne z DTD) tego elementu. Deklaracje przestrzeni nazw nie pojawiają się w tym zbiorze. Jeżeli ten element nie ma atrybutów, ten zbiór nie posiada żadnych elementów.
  6. [atrybuty przestrzeni nazw] Nieuporządkowany zbiór przedmiotów informacyjnych typu atrybut, jeden dla każdego z deklaracji przestrzeni nazw (określony lub domyślne z DTD) tego elementu. Deklaracje formularza xmlns="" i xmlns:name="", które nie deklarują odpowiednio domyślnej wartości przestrzeni nazw i prefiksów, liczą się jako deklaracje przestrzeni nazw. Niezdeklarowany prefiks był dodany w Przestrzeniach nazw w XML 1.1. Z definicji wszystkie atrybuty przestrzeni nazw (łącznie z tymi nazwanymi xmlns, których własność [prefiks] nie ma wartości) mają przestrzeń nazw URI http://www.w3.org/2000/xmlns/. jeżeli element nie posiada deklaracji przestrzeni nazw, ten zbiór nie ma elementów.
  7. [przestrzenie nazw in-scope] Nieuporządkowany zbiór przedmiotów informacyjnych typu przestrzeń nazw, jeden dla każdej z przestrzeni nazw w wyniku dla tego elementu. Ten zbiór zawsze zawiera przedmiot z prefiksem xml, który jest domniemany, związany z nazwą przestrzeni nazw http://www.w3.org/XML/1998/namespace. Nie zawiera przedmiotu z prefiksem xmlns (używanego dla deklarowania przestrzeni nazw), ponieważ aplikacja nigdy nie może napotkać elementu lub atrybutu z tym prefiksem. Zbiór będzie zaweirał przedmioty przestrzeni nazw odpowiadające wszystkim elementom [atrybuty przestrzeni nazw], z wyjątkiem jakichkolwiek deklaracji przedstawiającymi formularz xmlns="" orlub xmlns:name="", który nie deklaruje przestrzeni nazw, ale raczej nie deklaruje domyślnej wartości przestrzeni nazw i prefiksów. Podczas rozłączania prefiksów nazw złożonych ta własność powinna być używana w odniesieniu do własności [atrybuty przestrzeni nazw]; mogą być niezgodne z przypadkiem Syntetyczne zbiory informacji .
  8. [podstawowy URI] Podstawowy URI elementu.
  9. [przodek] Przedmiot informacyjny typu dokument lub element, zawierający ten przedmiot informacyjny w swojej własności [potomek].

2.3. Przedmioty informacyjne typu atrybut

Definicja XML: atrybut (Sekcja 3.1, Znaczniki początkowe, znaczniki końcowe, i znaczniki pustych elementów)

XML Syntax: [41] atrybut (Sekcja 3.1, Znaczniki początkowe, znaczniki końcowe, i znaczniki pustych elementów)

Jest przedmiot informacyjny typu atrybut dla każdego atrybutu (określonego lub domyślnego) każdego elementu w dokumencie, łącznie z tymi, które są deklaracjami przestrzeni nazw. Te drugie jednak pojawiają się jako elementy własności elementów [atrybuty przestrzeni nazw] raczej niż jego własności [atrybuty].

Atrybuty zdeklarowane w DTD bez wartości domyślnej i nieokreślone w znaczniku początkowym elementu nie są reprezentowane przez przedmioty informacyjne typu atrybut.

Przedmiot informacyjny typu atrybut posiada następujące wartości:

  1. [nazwa przestrzeni nazw] Nazwa przestrzeni nazw atrybutu jeśli jest taka. W przeciwnym razie ta własność nie ma wartości.
  2. [nazwa lokalna] Lokalna część nazwy atrybutu. Nie zawiera żadnych prefiksów przestrzeni nazw, ani występującego po nich dwukropków.
  3. [prefiks] Część prefiksu przestrzeni nazw atrybutu. Jeżeli przed nazwą nie ma prefiksu, ta własność nie ma wartości. Zauważ, że aplikacje świadome przestrzeni nazw powinny używać przestrzeni nazw raczej niż prefiksu do identyfikacji atrybutów.
  4. [znormalizowana wartość] Znormalizowana wartość atrybutu (patrz 3.3.3 Normalizacja wartości atrybutu [XML]).
  5. [określony] Znacznik stanu wskazujący czy ten atrybut był faktycznie określony w początkowym znaczniku swojego elementu, lub czy był domyślny z DTD.
  6. [typ atrybutu] Wskazanie typu zdeklarowanego dla tego atrybutu w DTD. Dozwolonymi wartościami są ID, IDREF, IDREFS, ENTITY, ENTITIES, NMTOKEN, NMTOKENS, NOTATION, CDATA, oraz ENUMERATION. Jeżeli nie ma deklaracji dla atrybutu, ta właściwość nie ma wartości. Jeżeli żadna deklaracja nie została odczytana, ale własność przedmiotu informacyjnego typu dokument [wszystkie deklaracje przetworzone] jest nieprawdziwa (więc może być nieodczytana deklaracja), wtedy wartość własności jest nieznana. Aplikacje nie powinny traktować wartości i nieznane jako równoważnik wartości CDATA. Na wartość tej własności nie wpływa ważność wartości atrybutu.
  7. [odnośniki] Jeżeli typ atrybutu to ID, NMTOKEN, NMTOKENS, CDATA, lub ENUMERATION, ta własność nie ma wartości. Jeżeli typ atrybutu jest nieznany, wartość tej własności jest nieznana. W przeciwnym razie (tj. jeżeli typem atrybutu jest IDREF, IDREFS, ENTITY, ENTITIES, lub NOTATION), wartość tej własności jest uporządkowaną listą przedmiotów informacyjnych typu element, niezanalizowany element rekordu, lub zapis do których jest odniesienie w wartości atrybutu, w porządku, w jakim tam występują. W takim wypadku jeżeli wartość atrybutu jest syntaktycznie nieważna, ta własność nie ma wartości. Jeżeli typem jest IDREF lub IDREFS i żaden z ID nie pojawia się jako wartość ID atrybutu w dokumencie, lub jeśli typem jest ENTITY, ENTITIES lub NOTATION i żadna deklaracja nie została odczytana dla jakichkolwiek elementów rekordu, bądź zapisu, wtedy ta własność nie ma wartości lub jest ona nieznana, zależnie od tego, czy własność przedmiotu informacyjnego typu dokument [wszystkie deklaracje przetworzone] jest prawdziwa czy fałszywa. Jeżeli typem jest IDREF lub IDREFS i żjakikolwiek z ID pojawia się jako wartość więcej niż jednego atrybutu ID w dokumencie, lub jeśli typem jest NOTATION i występują wielokrotne deklaracje dla zapisu, wtedy ta własność nie ma wartości.
  8. [element owner] Przedmiot informacyjny typu element zawierający ten przedmiot informacyjny w swojej własności [atrybuty].

2.4. Przedmioty informacyjne typu Instrukcja Przetwarzania

Definicja XML: instrukcja przetwarzania (Część 2.6, Instrukcje przetwarzania)

Skłądnia XML: [16] PI (Część 2.6, Instrukcje Przetwarzania)

Jest przedmiot informacyjny typu instrukcja przetwarzania dla każdej instrukcji przetwarzania w dokumencie. Deklaracja XML i deklaracje tekstowe dla zewnętrznych zanalizowanych elementów rekordu nie są uważane za instrukcje przetwarzania.

Przedmiot informacyjny typu instrukcja przetwarzania posiada następujące własności:

  1. [cel] Ciąg znaków przedstawiający część cel instrukcji przetwarzania (nazwa XML).
  2. [zawartość] Ciąg znaków przedstawiający zawartość instrukcji przetwarzania, z wyłączeniem celu i jakiekolwiek odstępy natychmiast następujące po nim. Jeśli nie ma takiej zawartości, wartością tej własności będzie pusty ciąg znaków.
  3. [podstawowy URI] Podstawowy URI PI. Zauważ, że zbiór informacji jest serializowany jako dokument XML, nie będzie możliwe, aby zachować podstawowy URI żadnego PI, który pierwotnie pojawił się na najwyższym poziomie zewnętrznego elementu rekordu, ponieważ nie ma składni dla PI odpowiadających atrybutom xml:base na elementach.
  4. [zapis] Przedmiot informacyjny zapis nazwany przez cel. Jeśli nie ma deklaracji dla zapisu z tą nazwą, lub są wielokrotne deklaracje, to ta własność nie ma wartości. Jeżeli żadna deklaracja nie została odczytana, ale własność elementu informacyjnego typu dokument [wszystkie deklaracje przetworzone] jest fałszywa (więc może być nieodczytana deklaracja), wtedy wartość tej własności jest nieznana.
  5. [przodek] Przedmiot informacyjny typu dokument, element, lub typ elementu deklaracji, który zawiera tę informację w swojej własności [potomek].

2.5. Przedmioty informacyjne typu nierozwiązalna referencja do elementu (ang.Unexpanded Entity Reference)

Definicja XML: Część 4.4.3, Zawarty w przypadku walidacji

przedmiot informacyjny typu nierozszerzony odnośnik elementu rekordu służy jako miejsce dla którego procesor XML może wskazać, że nie został rozszerzony zewnętrzny element rekordu. Taki przedmiot informacyjny istnieje dla każdego nierozszerzonego odnośnika do zewnętrznego elementu rekordu w obrębie zawartości elementu. Walidujący procesor XML, lub niewalidujący procesor czytający wszystkie zewnętrzne ogólne elementy rekordu, nigdy nie będą nigdy generować przedmiotów informacyjnych typu nierozszerzalny odnośnik elementu rekordu dla ważnego dokumentu.

Przedmiot informacyjny typu nierozszerzalny odnośnik elementu rekordu posiada następujące własności:

  1. [nazwa] Nazwa elementu rekordu, do którego się odnosi.
  2. [identyfikator systemowy] Identyfikator systemowy elementu rekordu, jak pojawia się w deklaracji elementu rekordu, bez jakichkolwiek dodatkowych uwalnianych URI zastosowanych przez procesor. Jeżeli nie ma deklaracji dla elementu rekordu, ta własność nie ma wartości. Jeżeli żadna deklaracja nie została odczytana, ale własność przedmiotu informacyjnego typu dokument [wszystkie deklaracje przetworzone] jest fałszywa (więc może być nieprzeczytana deklaracja), wtedy wartość tej własności jest nieznana.
  3. [identyfikator publiczny] Identyfikator publiczny elementu rekordu znormalizowany jak opisano w 4.2.2 Zewnętrznych elementach rekordu [XML]. Jeżeli nie ma deklaracji dla elementu rekordu, lub deklaracja nie zawiera identyfikatora publicznego, ta wartość nie ma wartości. Jeżeli żadna deklaracja nie została odczytana, ale własność przedmiotu informacyjnego typu dokument [wszystkie deklaracje przetworzone] jest fałszywa (więc może być nieprzeczytana deklaracja), wtedy wartość tej własności jest nieznana.
  4. [deklaracja podstawowego URI] Podstawowy URI dotyczący tego identyfikatora systemowego, z którego powinien być odłączony (tzn. podstawowy URI źródła w obrębie którego występuje deklaracja elementu rekordu). Jest to neznane, lub nie ma wartości w tych samych okolicznościach, co własność [identyfikator systemowy].
  5. [przodek] Przedmiot informacyjny typu element, który zawiera ten przedmiot informacyjny w jego własności [potomkowie].

2.6. Przedmioty informacyjne typu Znak

Składnia XML: [2] Char (Część 2.2, Znaki)

Występuje przedmiot informacyjny typu znak dla każdego znaku danych pojawiającego się w dokumencie, zarówno dosłownie, jak i odnośnik znaku, lub w obrębie sekcji CDATA.

Każdy znak jest logicznie oddzielnym przedmiotem informacyjnym, ale aplikacje XML mogą dzielić znaki w większe grupy jeśli jest to konieczne lub wymagane.

Przedmiot informacyjny typu znak posiada następujące własności:

  1. [kod znaku] Kod znaków ISO 10646 (w zakresie 0 do #x10FFFF, chociaż nie każda wartość w tym zakresie jest legalnym kodem znaków XML).
  2. [odstęp zawartości elementu] Logiczne wskazanie, czy znak to odstęp pojawiający się w obrębie odstępu zawartości elementu (patrz [XML], 2.10 "Użycie Odstępu"). Zauważ, że walidujące procesory XML są wymagane do zapewnienia tych informacji. Jeżeli nie ma deklaracji dla załączanego elementu, lub są wielokrotne deklaracje, ta własność nie posiada wartości znaków odstępu. Jeżeli żadne deklaracje nie zostały odczytane, ale własność przedmiotu informacyjnego typu dokument [wszystkie deklaracje przetworzone] jest fałszywa (więc może być nieprzeczytana deklaracja), wtedy wartość tej własności jest nieznana dla znaków odstępu. Zawsze jest fałszywe dla znaków, które nie są odstępami.
  3. [przodek] Przedmiot informacyjny typu element, zawierający ten przedmiot informacyjny w jego własności [potomek].

2.7. Przedmioty informacyjne typu Komentarz

Definicja XML: komentarz (Część 2.5, komentarze)

Składnia XML: [15] Komentarz (Część 2.5, Komentarze)

Jest przedmiot informacyjny typu komentarz dla każdego komentarza XML w oryginalnym dokumencie, z wyjątkiem tych pojawiających się w DTD (które nie są przedstawione).

Przedmiot informacyjny typu komentarz posiada następujące własności:

  1. [zawartość] Ciąg znaków przedstawiający zawartość komentarza.
  2. [przodek] Przedmiot informacyjny typu dokument lub element zawierający ten przedmiot informacji w swojej własności [potomek].

2.8. Przedmioty informacyjne typu Deklaracja Typu Dokumentu

Definicja XML: typ dokumentu i deklaracji (część 2.8, Język Prolog i typ deklaracji )

Składnia XML: [28] doctypedecl (część 2.8, Język Prolog i typ deklaracji)

Jeżeli dokument XML posiada deklarację typu dokumentu, wtedy zbiór informacji zawiera pojedynczy przedmiot informacyjny deklaracji typu dokumentu . Zauważ, że elementy rekordu i zapisy są zapewnione jako własności przedmiotu informacyjnego dokumentu, nie jako przedmiot informacyjny deklaracji typu dokumentu.

Przedmiot informacyjny deklaracji typu dokumentu posiada następujące własności:

  1. [identyfikator systemowy] Identyfikator systemowy zewnętrznego podzbioru informacji, pojawia się w deklaracji DOCTYPE, bez jakichkolwiek dodatkowych uwalnianych URI stosowanych przez procesor. Jeżeli nie ma żadnego zewnętrznego podzbioru, ta własność nie ma wartości.
  2. [identyfikator publiczny] Identyfikator publiczny zewnętrznego podzbioru, znormalizowany jak opisano w 4.2.2 Zewnętrzne elementy rekordu [XML]. Jeżeli nie ma żadnego zewnętrznego podzbioru, lub jeżeli nie ma publicznego identyfikatora, ta własność nie ma wartości.
  3. [potomkowie] Uporządkowana lista przedmiotów informacyjnych instrukcji przetwarzania przedstawiająca instrukcje przetwarzania pojawiające się w DTD w porządku oryginalnego dokumentu. Przedmioty z wewnętrznego podzbioru DTD pojawiające się przed tymi z zewnętrznego podzbioru.
  4. [przodek] Przedmiot informacyjny dokumentu.

2.9. Przedmioty informacyjne typu Element niezinterpretowany 

Definicja XML: element rekordu (część 4, Struktury fizyczne)

Składnia XML: [71] GEDecl (część 4.2, Elementy rekordu)

Występuje przedmiot informacyjny typu niezanalizowany element rekordu dla każdego niezanalizowanego ogólnego elementu rekordu zdeklarowanego w DTD.

Przedmiot informacyjnytypu niezanalizowany element rekordu posiada następujących własności:

  1. [nazwa] Nazwa elementu rekordu.
  2. [identyfikator systemowy] Identyfikator systemowy elementu rekordu, jak pojawia się w deklaracji elementu rekordu, bez jakichkolwiek dodatkowych odnośników URI stosowanych przez procesor.
  3. [identyfikator publiczny] Identyfikator publiczny elementu rekordu, znormalizowany jak opisano w 4.2.2 Zewnętrzne elementy rekordu [XML]. Jeżeli element rekordu nie ma publicznego identyfikatora, ta własność nie ma wartości.
  4. [deklaracja podstawowego URI] Podstawowy URI relatywny dla którego identyfikatora systemowego powinien być odłączony (tzn. podstawowy URI źródła w obrębie której deklaracji elementu rekordu występuje).
  5. [nazwa zapisu] Nazwa zapisu połączona z elementem rekordu.
  6. [zapis] Zapis przedmiotu informacyjnego nazwany przez nazwę zapisu. Jeżeli nie ma deklaracji dla zapisu z tą nazwą, lub są wielokrotne deklaracje, ta własność nie ma wartości. Jeżeli nie została odczytana deklaracja, ale własność [wszystkie deklaracje przetworzone] przedmiotu informacyjnego dokumenty jest fałszywa (więc może być nieodczytana deklaracja), wtedy wartość tej własności jest nieznana.

2.10. Przedmioty informacyjne typu zapis

Definicja XML: zapis (część 4.7, Zapisy)

Składnia XML: [82] NotationDecl (część 4.7, Zapisy)

Jest przedmiot informacyjny typu zapis dla każdego zapisu zdeklarowanego w DTD.

Przedmiot informacyjny typu zapis posiada nstępujące własności:

  1. [nazwa] Nazwa zapisu.
  2. [identyfikator systemowy] Identyfikator systemowy zapisu, jak pojawia się w deklaracji zapisu, bez jakichkolwiek dodatkowych odnośników URI stosowanych przez procesor. Jeżeli żaden identyfikator systemowy nie został określony, ta własność nie ma wartości.
  3. [identyfikator publiczny] Identyfikator publiczny zapisu, znormalizowany i opisany w 4.2.2 Zewnętrzne elemnty rekordu [XML]. Jeżeli zapis nie ma żadnego identyfikatora publicznego, ta własność nie ma wartości.
  4. [deklaracja podstawowego URI] Podstawowy URI relatywny dla którego identyfikatora systemowego powinien być odłączony (tzn. podstawowy URI źródła w obrębie której deklaracji zapisu występuje).

2.11. Przedmioty informacyjne typu Przestrzeń Nazw

Każdy element w dokumencie posiada przedmiot informacyjny przestrzeni nazw dla każdej przestrzeni nazw, która jest w zasięgu tego elementu.

Informacja o przestrzeni nazw posiada następujące właściwości:

  1. [prefiks] Prefiks, którego łączenie opisuje ten przedmiot. Syntaktycznie jest to część nazwy atrybutu następująca po prefiksie xmlns:. Jeżeli nazwą atrybutu jest po prostu xmlns, tak, żeby deklaracja była jego domyślną przestrzenią nazw, ta własność nie ma wartości.
  2. [nazwa przesrzeni nazw] Nazwa przestrzeni nazw, do której jest przyłączony prefiks.

3. Zgodność

Ponieważ celem zbioru informacji jest zapewnienie zbioru definicji, zgodność jest własnością specyfikacji używających tamtych definicji raczej niż implementacji.

Specyfikacje odnoszące się do zbioru informacji muszą:

Jeżeli specyfikacja zezwala na konstruowanie zbioru informacji, który zawiera niezgodności jak opisano poniżej Syntetyczne zbiory informacji, może opisać jak te niezgodności mają być rozwiązane i tak powinna zrobić, jeżeli zapewnia serializację zbioru informacji.

Dodatek A. Referencje

Referencje normatywne

ISO/IEC 10646
ISO (Międzynarodowa Organizacja Normalizacyjna). ISO/IEC 10646-1:2000. Technologia informacyjnay — Uniwersalny wielooktetowy zbiór kodowanych znaków (UCS) — Część 1: Struktura i podstawowa płaszczyzna wielojęzykowa oraz ISO/IEC 10646-2:2001.Technologia informacyjna — Uniwersalny wielooktetowy zbiór kodowanych znaków (UCS) — Część 2: Płaszczyzny dodatkowe, ponieważ, od czasu do czasu są poprawiane, zastępowane przez nowe edycje, lub rozszerzane przez dodawanie nowych części. [Genewa]: Międzynarodowa Organizacja Normalizacyjna. (Patrz http://www.iso.ch w celu sprawdzenia najnowszej wersji.)
Przestrzenie nazw
Przestrzenie nazw w XML, W3C, ed. Tim Bray, Dave Hollander, Andrew Layman. 14 stycznia 1999. Dostępne na http://www.w3.org/TR/REC-xml-names.
Przestrzenie nazw 1.1
Przestrzenie nazw in XML 1.1, W3C, ed. Tim Bray, Dave Hollander, Andrew Layman, Richard Tobin. 4 lutego 2004. Dostępne na http://www.w3.org/TR/xml-names11.
RFC2119
Słowa kluczowe dla użycia RFC do wskazania wymagania poziomów, ed. S. Bradner. marzec 1997. Dostępne na http://www.ietf.org/rfc/rfc2119.txt.
XML
Rozszerzalny język znaczników (XML) 1.0 (trzecia edycja), W3C, ed. Tim Bray, Jean Paoli, C.M. Sperberg-McQueen, Eve Maler, François Yergeau. 4 lutego 2004. Dostępny na http://www.w3.org/TR/REC-xml.
XML 1.1
Rozszerzalny język znaczników (XML) 1.1, W3C, ed. Tim Bray, Jean Paoli, C.M. Sperberg-McQueen, Eve Maler, John Cowan, François Yergeau. 4 lutego 2004. Dostępny na http://www.w3.org/TR/xml11.
Podstawa XML
Podstawa XML, W3C, ed. Jonathan Marsh. luty 2000. Dostępna na http://www.w3.org/TR/xmlbase.

Referencje nienormatywne

DOM
Specyfikacja DOM poziomu 1, W3C, ed. Vidur Apparao, Steve Byrne, Mike Champion, et al. 1 październik 1998. Dostępna na http://www.w3.org/TR/REC-DOM-Level-1.
XPointer-Liaison
Zbiór informacji XPointer- Oświadczenie Liaison , W3C, ed. Steven J. DeRose. 24 lutego 1999. Dostępne na http://www.w3.org/TR/NOTE-xptr-infoset-liaison.
Relatywne odnośniki przestrzeni nazw URI
Wyniki tajnego głosowania XML W3C na temat relatywnych odnośników w deklaracjach przestrzeni nazw, 3-17 lipca 2000, W3C, ed. Dave Hollander, C. M. Sperberg-McQueen. 6 września 2000. Dostępne na http://www.w3.org/2000/09/xppa.
Schemat RDF dla zbioru informacyjnego XML
Schemat RDF dla zbioru informacyjnego XML, W3C, ed. Richard Tobin. 6 kwietnia 2001. Dostępny na http://www.w3.org/TR/xml-infoset-rdfs.

Dodatek B: Wymagania raportowania XML (informacyjne)

Pomimo, że Rekomendacja [XML] jest zasadniczo związana ze składnią XML, również zawiera trochę specjalich wymagań raportowania dla porocesorów XML.

Wymagania raportowania zawierają błędy, które są poza zasięgiem tej specyfikacji i informacjo dokumentu. Wszystkie z wymagań XML dla raportowania informacji dokumentu zostały zintegrowane w zbiór informacyjny XML; numery w nawiasach odnoszą się do specyfikacji Rekomendacji XML:

  1. Procesor XML zawsze musi zapewnić wszystkie znaki w dokumencie, które nie są częścią znakowania dla aplikacji (2.10).
  2. Procesor walidacyjny XML musi informować aplikację o tym, który znak danych w dokumencie jest odstępem pojawiającym się się w obrębie zawartości elementu (2.10).
  3. Procesor XML musi znormalizować końce linii LF przed przekazaniem ich do aplikacji (2.11).
  4. Procesor XML musi znormalizować wartość atrybutów zgodnie z zasadami w klauzuli 3.3.3 przed przekazaniem ich do aplikacji.
  5. Procesor XML musi przekazać nazwy i zewnętrzne identyfikatory (identyfikatory systemowe, publiczne identyfikatory lub oba) zdeklarowanych zapisów do aplikacji (4.7).
  6. Kiedy nazwa niezanalizowanego elementu rekordu pojawia się jako wartość jawna, lub domyślna atrubutu ENTITY lub ENTITIES, procesor XML musi zapewnić nazwy, identyfikatory systemowe i (jeśli występują) identyfikatory publiczne obu elementów rekordu i ich zapisów do aplikacji (4.6, 4.7).
  7. Procesor XML musi przekazać instrukcje przetwarzania do aplikacji (2.6).
  8. Procesor XML (koniecznie niewalidujący), który nie zawiera zastępczego tekstu zewnętrznego zanalizowanego elementu rekordu w miejscu odnośnika elementu rekordu musi zawiadomić aplikację tak, że jest rozpoznana ale nie odczyta elementu rekordu (4.4.3).
  9. Walidujący procesor XML musi zawierać zastępczy tekst elementu rekordu w miejscu odnośnika elementu rekordu (5.2).
  10. Procesor XML musi dostarczyć wartość domyślną atrybutów zdeklarowanych w DTD dla danego typu elementu, ale nie pojawiających w począkowym znaczniku elementu. (3.3.2).

Dodatek C: Przykład (informacyjny-poglądowy)

Rozważ następujący przykłąd dokumentu XML:

<?xml version="1.0"?>

<msg:message doc:date="19990421"
             	xmlns:doc="http://doc.example.org/namespaces/doc"
             	xmlns:msg="http://message.example.org/"
>Phone home!</msg:message>

Zbiór informacji dla tego dokumentu XML zawiera następujące przedmioty informacyjne:

Dodatek D: Co nie jest zbiorem informacyjnym

Następujące informacje nie są przedstawione w obecnej wersji zbioru informacyjnego XML (ta lista nie ma na celu być kompletną):

  1. Modele zawartości elementów, z deklaracji ELEMENT w DTD.
  2. Grupowanie i porządkowanie deklaracji atrybutu w deklaracjach ATTLIST.
  3. Nazwa typu dokumentu.
  4. Odstęp elementu dokumentu.
  5. odstęp natychmiastowo następujące po nazwie celu PI.
  6. Czy znaki są przedstawiane przez odnośniki znaków.
  7. Różnica pomiędzy dwiema formami pustego elementu: <foo/> oraz <foo></foo>.
  8. Odstępy w obrębie początkowych znaczników (innych niż znaczące odstępy w wartościach atrybutów) i końcowe znaczniki.
  9. Różnica pomiędzy CR, CR-LF, oraz zakończeniem linii LF.
  10. Porządek atrybutów w obrębie początkowego znacznika.
  11. Porządek deklaracji w obrębie DTD.
  12. Brzegi części warunkowych w DTD.
  13. Brzegi parametrów elementów rekordu w DTD.
  14. Komentarze w DTD.
  15. Lokalizacja deklaracji (czy w wewnętrznym, czy zewnętrznym podzbiorze, lub parametrach elementu rekordu).
  16. Jakiekolwiek ignorowane deklaracje, łącznie z tymi w obrębie części warunkowej IGNORE, jak i deklaracjami elementu rekordu i atrybutu ignorowanymi ponieważ poprzednie deklaracje nakładają sie na nie.
  17. Rodzaj znaków cudzysłów (pojedzynczy lub podwójny) używany do cytowania wartości atrybutów.
  18. Brzegi ogólnych zanalizowanych elementów rekordu.
  19. Brzegi oznaczonych sekcji CDATA.
  20. Wartość domyślna atrybutów zdeklarowanych w DTD.

Dodatek E: Schemat RDF (informacyjny-poglądowy)

See Schemat RDF dla zbioru informacyjnego XML dla formalnego znakowania zbioru informacji.