Езикът за маркиране на данни е. Какво е HTML език за маркиране. Други XML базирани разработки

HTML език за маркиране

Досега има много технологии за създаване на уеб страници, без които един уеб администратор не може. Но основата за разработване на уеб документи е, разбира се, хипертекстовият език за маркиране HTML.

HTML е предимно език за маркиране и кодът, написан на него, се изпълнява на компютъра на клиента в приложение за уеб браузър. Това се дължи на неговата относителна простота и лекота на учене.

Защо се нуждаем от език за маркиране?

Когато създавате обикновен документ в програма за текстообработваща програма, можете лесно да форматирате документа, като например да зададете знаци в курсив или получер, да зададете абзац на заглавие или стил на обикновен текст и т.н. Това, което правите като документ на екрана на монитора, се прехвърля в същата форма на хартия, когато се отпечата на принтер.

Независимо дали изберете опция от падащите менюта или подадете команда от клавиатурата, вие незабавно виждате резултатите от вашите усилия на екрана. Въпреки това, специфичните команди, които реализират показването на документа на екрана или на хартия, ще бъдат скрити от вас.

В случай на уеб страници, потребителят работи не с хартиени, а с електронни документи, получени чрез Интернет. Принципът на показване на документ с помощта на инструментите за форматиране на родителското приложение тук е неприемлив. Потребителят ще трябва да има твърде много приложения или всякакви конвертори на своя компютър, за да работи ефективно с многото възможни формати на документи.

Идеята за решаване на проблема с обмена на документи между различни компютри и приложения чрез интернет се основава на хипертекстовия език за маркиране HTML (HyperText Markup Language). Този език е създаден преди повече от 15 години като стандарт за форматиране на документи и е приет от огромното мнозинство интернет потребители и най-важното от всички производители на софтуер и хардуер за мрежата. Маркираните в HTML документи могат да се четат на всеки компютър, на който е инсталирана само една програма за преглед на такива документи - браузър.

Благодарение на езика за маркиране HTML, уеб клиентът може да види документ на екрана на компютъра си във формата, в която разработчикът го е предвидил: с определени размери на шрифта и разбивки на абзаци, с определена подредба на картини, хипервръзки и др.

Текстовият документ, написан на HTML, има размер в байтове няколко пъти по-малък от размера на подобен документ, изготвен в текстообработваща програма (например Word).

Berners-Lee (разработчикът) основава разработвания език на езика SGML и техниките за работа с хипертекст, поради което името на създадения от него език - HTML - е свързано. Нов езикизползва основни SGML конструкции за описание на документи и хипертекстови връзки.


Хипер тексте начин за организиране на текст, графики и други данни, при който елементите на данните са свързани един с друг. Могат да бъдат свързани както елементи от един документ, така и елементи от различни документи. Хипертекстовата структура е в основата на World Wide Web.

Хипертекстовете са електронни документи. С хипертекстовете може да се работи само на компютър; хипертекстовете не съществуват в печатна форма. Пример за хипертекстова система е добре познатата помощна система на Windows.

Връзкив хипертекстова структура се извършват с помощта на връзки.Благодарение на връзките потребителят може да извика друг документ от един документ, следващия документ от него и т.н.

През 1989 г. Бърнърс-Лий разработва информационна система, която прилича на мрежа от свързани документи. Документите се съхраняват на сървъри, разположени по целия свят и свързани помежду си чрез интернет канали. Той се разви HTTP протокол - езикът, на който сървърите трябва да обменят хипертекстови документии написа първия уеб сървър и програми за браузър. Той се обърна директно към интернет общността и ентусиастите започнаха да създават първите уеб сайтове през 1991 г.

През следващите години World Wide Web се ​​разраства бързо и се превръща в най-популярната услуга в Интернет. В момента той задоволява информационните нужди на широк кръг потребители, включително милиони уеб сайтове. Големите сайтове съдържат хиляди и стотици хиляди документи, а общият брой на документите в WWW се увеличава всяка секунда, тъй като огромна армия от специалисти и аматьори в различни части на земното кълбо работят върху тяхното създаване.

World Wide Webили за краткоуеб- е глобална хиперразпределителна система текстова информация, използвайки интернет като транспортен канал.

Всъщност World Wide Web е хипертекстово документно пространство, което не е свързано с географията на самите уеб сайтове. Следователно в това пространство физическото разстояние между възлите няма смисъл. По същия начин можете да видите на екрана на монитора уеб страници, които се съхраняват както на компютърен диск в съседната стая, така и на сървър, намиращ се в друга държава.

Световната мрежа работи според определени стандарти, които са разработени и внедрени от асоциация на изследователски и индустриални организации - консорциум W3C(съкратено от World Wide Web Consortium). .

Езикът за маркиране на HTML се основава на езика SGML. Средства за маркиране на параграфи, заглавия, списъци и други елементи, налични в HTML, също бяха предоставени в SGML. Заслугата на изобретателя на HTML е, че той въведе в езика за маркиране нещо, което SGML нямаше - това са хипертекстови връзки.

Езикът за маркиране на документи е набор от специални инструкции, наречени тагове, предназначени да формират структура в документи и да определят връзките между различните елементи на тази структура. Езиковите тагове или контролните тагове, както понякога се наричат, в такива документи се разграничават от основното съдържание на документа и служат като инструкции за програмата, която показва съдържанието на документа от страна на клиента. Най-ранните системи са използвали символите „<” и “>“, вътре в който бяха поставени имената на инструкциите и техните параметри. Сега този начин за обозначаване на тагове е стандартен.

Използване на хипертекстова разбивка на текстов документ в съвременния информационни системиТова до голяма степен се дължи на факта, че хипертекстът ви позволява да създадете механизъм за нелинейно гледане на информация. В такива системи данните се представят не като непрекъснат поток от текстова информация, а като набор от взаимосвързани компоненти, които се навигират с помощта на хипервръзки.

Най-популярният език за маркиране на хипертекст днес, HTML, е създаден специално за организиране на информация, разпространявана в Интернет, и е един от ключовите компоненти на WWW технологията. С използването на модела на хипертекстовия документ начинът за представяне на различни информационни ресурси в мрежата стана по-подреден, а потребителите получиха удобен механизъм за търсене и преглед на необходимата информация.

HTML е опростена версия на стандарта общ езикмаркиране - SGML (Standard Generalized Markup Language), който беше одобрен от ISO като стандарт още през 80-те години. Този език е предназначен за създаване на други езици за маркиране; той дефинира валиден набор от тагове, техните атрибути и вътрешната структура на документа. Контролът върху правилното използване на дескриптори се извършва с помощта на специален набор от правила, наречени DTD описания, които се използват от клиентската програма при анализиране на документа. За всеки клас документи се дефинира собствен набор от правила, които описват граматиката на съответния език за маркиране. С помощта на SGML можете да описвате структурирани данни, да организирате информацията, съдържаща се в документи, и да представяте тази информация в някакъв стандартизиран формат. Но поради част от своята сложност, SGML се използва главно за описание на синтаксиса на други езици (най-известният от които е HTML) и малко приложения работят директно с SGML документи.

Много по-прост и удобен от SGML, езикът HTML ви позволява да определяте дизайна на елементите на документа и има определен ограничен набор от инструкции - тагове, с помощта на които се извършва процесът на маркиране. HTML инструкциите са предназначени основно да контролират процеса на показване на съдържанието на документ на екрана на клиентска програма и по този начин да определят начина, по който документът е представен, но не и неговата структура. Елементът на хипертекстова база данни, описан от HTML, е текстов файл, който може лесно да се предава по мрежата с помощта на HTTP протокола. Тази функция, както и фактът, че HTML е отворен стандарт и голяма сумапотребителите имат възможност да използват възможностите на този език, за да проектират своите документи, което със сигурност повлия на нарастването на популярността на HTML и го превърна днес в основен механизъм за представяне на информация в мрежата.

Съвременните приложения обаче изискват не само език за представяне на данни на екрана на клиента, но и механизъм, който ви позволява да определите структурата на документа и да опишете елементите, които съдържа. HTML има прост набор от команди и доста успешно се справя със задачата да опише текстова информация и да я покаже на екрана на програма за преглед - браузър. Самите показани данни обаче по никакъв начин не са свързани с таговете, които се използват за форматиране, така че програмите за синтактичен анализ нямат възможност да използват HTML тагове, за да намерят фрагментите от документа, от които се нуждаем. Тези. като се сблъскват например с такова описание

роза

зрителят ще знае какъв цвят да покаже текста, съдържащ се в етикетите и вероятно ще го покаже правилно, но е абсолютно безразлично къде в документа се намира този таг, в какви други тагове е затворен текущият фрагмент, дали съществуват фрагменти, вложени в него, или дали връзките между обектите са изградени правилно. Това „безразличие“ към структурата на документа води до факта, че търсенето или анализирането на информация в него няма да се различава от работата с непрекъснат текстов файл, който не е разделен на елементи. И това, както знаете, не е най-много ефективен методработа с информация.

Друг съществен недостатък на HTML е ограниченият набор от тагове. DTD правилата за HTML дефинират фиксиран набор от дескриптори и следователно разработчикът няма възможност да въвежда свои собствени, специални тагове. Въпреки че от време на време се появяват нови езикови разширения, дълги разстояниятяхната стандартизация, придружена от постоянни разногласия между основните производители на браузъри, прави почти невъзможно бързото адаптиране на езика, използването му за показване на специализирана информация (например мултимедийна, математическа, химични формулии т.н.).

За да обобщим всичко казано, може да се твърди, че HTML днес не отговаря напълно на изискванията, наложени от съвременните разработчици за езици от този вид. И беше заменен от нов език за маркиране на хипертекст, мощен, гъвкав и в същото време удобен XML език.

XML (Extensible Markup Language) е език за маркиране, който описва цял клас от обекти с данни, наречени XML документи. Този език се използва като средство за описание на граматиката на други езици и контрол на коректността на документите. Тези. Самият XML не съдържа етикети, предназначени за маркиране, той просто дефинира реда, в който са създадени. Така, ако например смятаме, че трябва да използваме етикета, за да посочим елемента роза в документа ; тогава XML ни позволява свободно да използваме тага, който дефинираме, и можем да включим фрагменти като следното в документа:

роза

Наборът от тагове може лесно да се разшири. Ако, да предположим, също така искаме да посочим, че описанието на цветето трябва смислено да влезе в описанието на оранжерията, в която цъфти, тогава просто задаваме нови тагове и избираме реда, в който се появяват:

роза

Процесът на създаване на XML документ е много прост и изисква само основни познания по HTML и разбиране на задачите, които трябва да бъдат изпълнени с помощта на XML като език за маркиране. Това дава на разработчиците уникалната възможност да дефинират персонализирани команди, които им позволяват най-ефективно да дефинират данните, съдържащи се в документа. Авторът на документа създава неговата структура, изгражда необходимите връзки между елементите, използвайки онези команди, които отговарят на неговите изисквания, и постига типа маркиране, който му е необходим, за да извърши операциите по преглед, търсене и анализ на документа.

Друго очевидно предимство на XML е възможността да се използва като универсален език за заявки за информационни хранилища. Днес W3C обмисля работеща версия на стандарта XML-QL (или XQL), който може да бъде сериозен конкурент на SQL в бъдеще. В допълнение, XML документите могат да действат като уникален начин за съхраняване на данни, който включва както средствата за анализиране на информация, така и представянето й от страна на клиента. В тази област една от обещаващите области е интегрирането на Java и XML технологиите, което прави възможно използването на мощността на двете технологии при изграждане на машинно независими приложения, които също използват универсален формат на данни за обмен на информация.

XML също ви позволява да контролирате коректността на данните, съхранявани в документи, да проверявате йерархичните връзки в рамките на документа и да установявате единен стандарт за структурата на документите, чието съдържание може да бъде различни данни. Това означава, че може да се използва при изграждане на сложни информационни системи, в които въпросът за обмена на информация между различни приложения, работещи в една и съща система, е много важен. Създавайки структура за механизъм за обмен на информация в самото начало на работа по даден проект, мениджърът може да се спаси в бъдеще от много проблеми, свързани с несъвместимостта на форматите на данни, използвани от различни компоненти на системата.

Също така, едно от предимствата на XML е, че програмите, които обработват XML документи, не са сложни и всички видове софтуерни продукти, предназначени за работа с XML документи, вече са се появили и се разпространяват свободно. XML се поддържа в IE5. Беше обявено, че ще се поддържа в следващите версии на приложенията Netscape Communicator, Oracle DBMS, DB-2 и MS-Office. Всичко това дава основание да се предположи, че най-вероятно в близко бъдеще XML ще стане основният език за обмен на информация за информационните системи, като по този начин ще замени HTML. Известни специализирани езици за маркиране като SMIL, CDF, MathML, XSL вече са създадени на базата на XML и списъкът с работни проекти на нови езици, които се разглеждат от W3C, непрекъснато нараства.

Езикът XSLT се използва за обработка на документи, извършване на промени и необходими допълнения към маркирането. Може да се използва за конвертиране на XML код във форматиран HTML код, който е лесен за четене от хората. Можете също да конвертирате XML документа в обикновен текст или друг преструктуриран XML документ, или дори JavaScript документ. Езикът XSLT осигурява достъп до съдържанието на XML документите и също така се използва за създаване на нови документи въз основа на тях. Поради посочените по-горе причини си струва да изучавате езика XSL.

Най-често срещаният процес е да конвертирате XML документи в HTML документи и това е операцията, обхваната в примерите в тази глава.

За извършване на XSLT трансформация се използват два документа: документът, който се конвертира, и стиловият лист, който дефинира самата трансформация. В случая говорим за XML документи.

В системите за текстообработка документът включва Допълнителна информация, наречено маркиране и изпълнява следните функции:

Избор логически елементитози документ;

Настройка на функции за обработка на избрани елементи.

В конвенционалните текстообработващи програми има вградени команди за включване/изключване на шрифтове и др., подобни на командите за управление на разположението на информацията на екрана или при печат (т.нар. Escape последователности).Този подход се нарича командно или процедурно маркиране (Таблица 2.1).

Алтернативна техника за маркиране е да се избере част от текста, без да се уточнява как трябва да се обработва селекцията. След това други команди задават как трябва да се обработват фрагментите. Тази маркировка се нарича описателен(описателно). Той включва тагове (тагове, тагове)началото и края на текстов елемент и показва как да се интерпретира даден фрагмент.

Чрез промяна на набора от процедури, съответстващи на описателно маркиране, можете да промените външния вид на същия документ. Развитието на идеите за описателното маркиране доведе до дефинирането на маркирането като формален език. Това ви позволява да проверите правилността на маркирането и да минимизирате неговия обем, като замените настройките по подразбиране.

Основното предимство на описателното маркиране е неговата гъвкавост, тъй като части от текст са маркирани като „какви са“ (а не „как трябва да бъдат изобразени“) и в бъдеще може да бъде написан софтуер, който да обработва тези части по начини, предвидени от дизайнерите на езика. Например HTML хипервръзките, първоначално предназначени за потребителите да навигират през набор от връзки в Интернет, по-късно започнаха да се използват от механизми за търсене и индексиране в Интернет, за оценка на популярността на ресурси и т.н.

Описателното маркиране също улеснява преформатирането на документа, ако е необходимо, тъй като описанието на формата не е свързано със съдържанието. Например, курсивможе да се използва или за подчертаване на текст, за маркиране на чужди (или жаргонни) думи или за други цели.

Въпреки това, ако думите са просто подчертани (описателно или процедурно) като курсив, тази неяснота не може да бъде напълно разбрана. Ако двата случая са били етикетирани по различен начин в началото, всеки може да бъде преформатиран независимо от другите. Общо маркиране е другото име за описателно маркиране.

Практически елементи различни класовемаркировките обикновено съществуват съвместно във всяка дадена система. Например HTML съдържа както елементи за маркиране, които са процедурни (b за получер), така и други, които са описателни (атрибутът "blockquote" или "href"). HTML също включва pre елемент, който ограничава областта на текста, която ще бъде позиционирана точно както е въведена.



Повечето модерни системиописателното маркиране третира документите като йерархични структури(дървета) и също така предоставя някои съоръжения за вградено кръстосано препращане. Следователно такива документи могат да се третират и обработват като бази данни, чиято структура е доста добре дефинирана (обаче, тъй като те нямат толкова строги схеми като релационни бази данни, те обикновено се наричат ​​„слабо структурирани бази данни“).

С настъпването на 3-то хилядолетие възниква интерес към документи с не-йерархични структури. Например древната и религиозна литература обикновено има реторична или прозаична структура (разказ, раздел, параграф и т.н.) и също така включва основна информация (книги, глави, строфи, редове). Тъй като границите на тези модули често се припокриват, те не могат да бъдат напълно кодирани, като се използва само дървовидна система за маркиране. Системите за моделиране на документи, които поддържат такива структури, включват MECS, TEI Насоки, LMNL и CLIX.

Терминът „маркиране“ идва от традиционната практика за маркиране на ръкописи преди публикуване (т.е. добавяне на символни команди в полетата и между редовете на хартиен ръкопис), правена от векове от издателски работници (редактори и коректори), които отбелязват какъв шрифт , стил и Фрагменти от текст трябваше да бъдат набрани с шрифт и след това ръкописът беше предаден на наборчици, които ръчно набраха текста, като взеха предвид знаците за маркиране.



В момента има много езици за маркиране (Таблица 2.2), сред най-известните са DocBook,

MathML, SVG, Open eBook, XBRL и др. Те са предназначени главно да представят различни текстови документи, но специализираните езици могат да се използват в много други области. Разбира се, най-известният език за маркиране е HTML (HyperText Markup Language), една от основите на WWW (World Wide Web).

Нека да разгледаме някои от системите за маркиране.

RUNOFF беше първата система за форматиране на текст, която постигна значителна слава. Разработен е през 1964 г. за операционна система CTSS от Jerome H. Saltzer с помощта на MAD асемблер.

Продуктът всъщност се състоеше от няколко програми:

TYPSET, който всъщност беше редактор на документи;

RUNOFF - изходен процесор.

RUNOFF предостави поддръжка за пагиниране и поставяне на заглавия, както и подравняване на текст. RUNOFF е пряк предшественик на програмата за форматиране на документи в Multics OS, която от своя страна е предшественик на програмите за форматиране за Unix OS (roff и nroff) и техните наследници. Той беше и предшественикът на FORMAT за OS/360 на IBM и, разбира се, косвено за всички следващи програми и системи за текстообработка. Смята се, че името идва от фраза, популярна по това време - Ще избягам копие.

TeX е съкращение от τεχνη (TEXNH - techne), гръцки термин за "изкуство, занаят, умение", източникът на думата "технически". На английски се произнася "тек" (както в технология).

TeX е система за набор, създадена от Доналд Кнут. Заедно с езика METAFONT за описание на шрифтове и Computer Modern шрифт, той е проектиран за две основни цели - първо, да предостави на всеки потребител възможността да създава висококачествени книги в рамките на разумно количество усилия, и второ, така че такъв системата ще даде идентични резултати на всички компютри, както сега, така и в бъдеще. TeX е безплатен софтуер, популярен в академичната общност, особено сред математици, компютърни физици, икономисти и в техническите общности. Той се конкурира силно с друг популярен инструмент за форматиране на TeX, Unix troff, и много инсталации на Unix използват двете заедно.

TeX е признат за най-добрия начин за създаване и отпечатване на сложни математически формули, но сега се използва и за много други задачи за набор, особено под формата на LaTeX и друг софтуер за форматиране.

Командите на TeX обикновено започват с обратна наклонена черта и са групирани в блокове с фигурни скоби. Въпреки това почти всичко синтактични свойства TeX може да бъде променен по време на изпълнение на програмата, което затруднява обработката на входа на TeX от други програми. TeX е език, базиран на макроси и токени, и много команди, включително най-често дефинираните от потребителя, се разширяват при изпълнение, докато останат само неразширяеми токени, които се изпълняват.

Основната версия на TeX включва приблизително 300 команди, наречени примитиви. Въпреки това, тези екипи ниско ниворядко се използва директно от потребителите, повечето функционалности се осигуряват от файлови формати (копия на TeX памет след зареждане на големи набори от макро инструкции). Оригиналният (по подразбиране) формат на Nut, който добавя приблизително 600 команди, се нарича Plain Tech. По-широко използван формат е LaTeX, първоначално разработен от Лесли Лампорт, който включва стилове на документи за книги, писма, слайдове и т.н., а също така добавя поддръжка за препратки и автоматично номериране на формули и секции.

Друг широко използван формат е AMS-TeX, разработен от Американското математическо общество и предоставя много допълнителни приятелски команди, които могат да бъдат модифицирани от издателите, за да отговарят на тяхната марка. Повечето от функциите на AMS-TeX могат да се използват в LaTeX чрез използване на AMS "пакети" (наричани AMS-LaTeX).

За да напишете програма за отпечатване на реда "Програмиране" в Plain TeX, трябва да създадете файл myfile.tex със следното съдържание:

\bye % край на файла; не се показва в крайния резултат.

По подразбиране всичко, следващо знака за процент на ред, е коментар, игнориран от интерпретатора на TeX. Ако стартирате Tex на този файл (например, като напишете tex myfile.tex в режим на команден ред), ще бъде създаден изходен файл, наречен myfile.dvi, който представя съдържанието на страницата във формат, независим от устройството (DVI). Резултатите могат или да бъдат отпечатани директно от визуализатора на интерактивна цифрова видео система, или конвертирани в по-общ формат като PostScript с помощта на програмата dvips. Вариантите на TeX като PDFTeX създават директно PDF файлове.

Нека да разгледаме форматирането на математическа формула. Например, за да напишете добре познат израз за корен на квадратно уравнение, можете да въведете:

Квадратната формула е $-b \pm \sqrt(b^2 - 4ac) \over 2a$ \bye

Това ще изведе следния текст:

Няколко системи за обработка на документи са базирани на TeX, по-специално jadeTeX, който използва TeX като back-end за извеждане на изход от DSSSL Engine на Джеймс Кларк, и Texinfo, процесорът за документация на GNU, е официалният наборен пакет за операционната система GNU от 1984 г.

Има многобройни разширения и свързани програми за TeX, включително BibTeX за библиографии (разпространен с LaTeX), PDFTeX, който заобикаля DVI формата и извежда директно в Portable Document Format (pdf) на Adobe Systems и Omega, който позволява на TeX да използва задайте Unicode знаци. Повечето TeX разширения могат да бъдат получени безплатно от Comprehensive TeX Archive Network (CTAN - редактор). научна литературабазиран на TeX, поддържа режим WYSIWYG и е проектиран да бъде съвместим с TeX и Emacs.

В много технически области, като приложна компютърна наука, математика и физика, TeX се превърна в де факто стандарт. Много хиляди книги са публикувани с помощта на TeX от издатели като Addison-Wesley, Cambridge University Press, Elsevier, Oxford University Press или Springer. Многобройни списания в тези области се създават с помощта на TeX или LaTeX, като на авторите е разрешено да изпращат ръкописи във формат TeX.

Започвайки с версия 3, TeX използва специфична система за номериране на версиите, където актуализациите са посочени с помощта на допълнителен номер за десетично числотака че номерът на версията асимптотично да се доближава до l. Това е отражение на факта, че TeX е много стабилен и се очакват само малки актуализации. Текущата версия на TeX е 3.141592; това беше последно актуализирано през декември 2002 г.

Изпратете добрата си работа в базата знания е лесно. Използвайте формата по-долу

Студенти, докторанти, млади учени, които използват базата от знания в обучението и работата си, ще ви бъдат много благодарни.

Подобни документи

    Дефиниция на понятието хипертекст. Основни части на SGML документ. Историята на създаването на стандартния език за маркиране на HTML документи. Разлики между синтаксиса на XHTML и HTML. RSS е семейство от XML формати за описание на емисии с новини. Използване на езика за маркиране KML.

    презентация, добавена на 15.02.2014 г

    Основи на езика за програмиране на уеб страници – HTML. Видове информация, която може да съдържа една уеб страница: текст, графика, звук, анимация и видео. Инструментариум за създаване на уеб страници. Основни HTML редактори, използвани за уеб дизайн.

    резюме, добавено на 19.01.2011 г

    основни характеристикиЕзик за маркиране на хипертекст. Структура на HTML документ. Преглед на основните характеристики на HTML. Елементи на модерен дизайн на уеб страница. Анализ на практическото приложение на HTML (на примера на обучителни програми).

    курсова работа, добавена на 24.11.2012 г

    Основни тагове и атрибути на езика HTML. Създаване на уеб сайт, който трябва да се състои от няколко свързани помежду си страници. Обмислете различните значения на атрибутите и таговете на страници и други документи. Екранни форми на разработени страници.

    лабораторна работа, добавена на 16.04.2014 г

    Какво е маркиране? Езикът за маркиране е набор от конвенции за форматиране, които се използват за кодиране на блокове от текст. Възможности за формати SGML, HTML, XML, история на създаване, специфика на приложение, контрол върху разполагането на информация.

    резюме, добавено на 22.03.2010 г

    Нов език за маркиране на хипертекст XHTML. Валидиране на XHTML документи, определяне на техния тип. Често срещани грешки в XHTML маркирането. Съответствие с потребителски агент. Използване на XHTML с други пространства от имена. Разширяване на HTML семантиката.

    курсова работа, добавена на 14.07.2009 г

    Изучаване на алгоритъма за рекурсивно спускане и система за изграждане на граматика с помощта на лексикалния анализатор Lex. Писане на програма за интерпретатор на HTML език за маркиране. Проверка на входната последователност за коректност на въвеждането като обща функция на програмата.

    тест, добавен на 25.12.2012 г

Терминът "маркиране" идва от традиционната практика за маркиране на ръкописи преди публикуване (тоест добавяне на символни команди в полетата и между редовете на хартиен ръкопис).

В продължение на много векове това се правеше от издателски работници (редактори и коректори), които отбелязваха какъв шрифт, стил и размер на точките фрагменти от текста трябва да бъдат напечатани, и след това предаваха ръкописа на наборчици, които ръчно набираха текста, като взеха предвид маркировката герои.

Маркиращ езике набор от специални инструкции, наречени тагове, които изпълняват следните функции:

      настройка на функции за обработка на избрани елементи;

      подчертаване на логическите елементи на даден документ.

Настройка на функции за обработка на избрани елементи

Текстообработващите програми имат вградени команди за включване/изключване на шрифтове и други, подобни на командите за управление на разположението на информацията на екрана или при печат. Този подход се нарича екипили процедурно маркиране.

Примери за процедурно маркиране

Избор на логически елементи на документ

Служи за формиране на структура в документи и определяне на връзките между различните елементи на тази структура, без да се уточнява методът на обработка. Тази маркировка се нарича описателен.

Чрез промяна на набора от процедури, съответстващи на описателно маркиране, можете да промените външния вид на същия документ.

Описателно маркиране

Основното предимство на описателното маркиране е неговата гъвкавост, тъй като части от текст са маркирани за „какво представляват“ (а не „как трябва да се показват“).

В бъдеще може да бъде написан софтуер за обработка на тези фрагменти по начини, които дори не са били предвидени от разработчиците на езика. Например HTML хипервръзките, първоначално предназначени за потребителите да навигират през набор от връзки в Интернет, по-късно започнаха да се използват от механизми за търсене и индексиране в Интернет, за оценка на популярността на ресурсите и т.н.

Примери за маркиращи езици

Езиците за маркиране се използват навсякъде, където се изисква извеждане на форматиран текст:

    при печат (SGML, TeX, PostScript, PDF),

    компютърни потребителски интерфейси (MicrosoftWord,OpenOffice,troff),

    World Wide Web (HTML,XHTML,XML,WML,VML,PGML,SVG,XBRL).

Структура на тагове на език за маркиране

Развитието на идеите за описателното маркиране доведе до дефинирането на маркирането като формален език.

Езиковите тагове (контролни дескриптори) са кодирани по определен начин (разпределени спрямо основното съдържание на документа) и служат като инструкции за програмата, която показва съдържанието на документа от страна на клиента.

Много съвременни езици са използвали символите за представяне на тези команди (езикови тагове)< и >, вътре в който бяха поставени имената на инструкциите и техните параметри (HTML и XML). В SGML можете да зададете други знаци, за да оградите етикет (като къдрави скоби). Освен това има различни системи от подмножества езици, които се използват, с по-малки възможности, например уеб форуми и табла за съобщения използват езика за маркиране BBCode, чиито тагове са разделени със знаци в квадратни скоби: .

Тагираният модел описва документ като колекция от контейнери, всеки от които започва и завършва с тагове. В повечето случаи таговете се използват по двойки. Двойката се състои от отварящ (начален етикет) и затварящ (краен етикет) тагове.

Синтаксис на отварящия етикет:<имя_тега [атрибуты]>

Името на затварящия таг се различава от името на отварящия таг само по това, че е предшествано от наклонена черта:

Атрибутите определят допълнителни характеристики на даден елемент. Атрибутите на етикета се записват в следния формат: име[="стойност"]. За някои атрибути стойността може да не е посочена. Затварящият таг няма атрибути.

Действието на всеки сдвоен таг започва с отварящия таг и завършва, когато се срещне съответният затварящ таг.

Двойката отварящи и затварящи тагове се нарича контейнер, а частта от текст между тях се нарича елемент.

Заглавка от ниво 1

Заглавка от ниво 2

В зависимост от използвания език за маркиране е възможно допълнително да използвате един таг и празен таг за елемент. Името на етикета определя типа на елемента.

Синтаксис на един етикет:<имя_тега [атрибуты] />

В някои езици за маркиране имената на таговете са предварително дефинирани (HTML). В други не са строго регламентирани, т.е. потребителите могат да въвеждат и използват нови тагове (XML). Например тагът „персона“ може да дефинира типа на този XML елемент като фамилия, собствено име и бащино име. Иванов Иван Иванович

В SGML елементите могат да се пресичат, т.е. в SGML е възможна следната последователност от тагове:

В XML елементите имат стриктна синтактична структура, тоест те трябва да бъдат стриктно вложени един в друг и винаги затворени:

Освен това в SGML, HTML не се изисква те да бъдат лични:

В почти всички езици за маркиране на документи стойността на атрибута се интерпретира като текст. Стойността на атрибута обикновено е затворена в кавички.

Забележка:

Документ, написан с помощта на език за маркиране, съдържа не само самия текст (като последователност от думи и препинателни знаци), но и допълнителна информация за различните му части - например указание за заглавия, акценти, списъци и т.н.

Тези. документът не е нищо повече от обикновен ASCII файл с добавени към него контролни кодове (тагове).