Мовою розмітки даних є. Що таке мова розмітки HTML. Інші розробки, засновані на XML

Мова розмітки HTML

На цей час існує безліч технологій створення Web-сторінок, без яких не може обійтися Web-майстер. Але основою при розробці документів Web є, звичайно, мова гіпертекстової розмітки HTML.

HTML - це, перш за все, мова розмітки, і код, написаний на ньому, виповнюється на комп'ютері клієнта в додатку Web-браузера. З цим пов'язана його відносна простота і легкість освоєння.

Навіщо потрібна мова розмітки?

Коли ви створюєте звичайний документ в програмі текстового процесора, ви легко можете виконувати форматування документа, наприклад, для символів задати курсив або напівжирний шрифт, абзацу привласнити стиль заголовка або звичайного тексту і т.д. Те, що ви робите сдокументом на екрані монітора, в тому ж вигляді переноситься на папір, надрукованих на принтері.

Вибираєте ви опцію з випадаючих меню або даєте клавішну команду, ви відразу бачите на екрані результат ваших зусиль. Однак конкретні команди, які реалізують відображення документа на екрані або на папері, будуть приховані від вас.

У разі Web-сторінок користувач має справу не з паперовими, а з електронними документами, отриманими через Internet. Принцип відображення документа засобами форматування батьківського додатка тут неприйнятний. Занадто багато додатків або всіляких конверторів користувачеві довелося б мати на своєму комп'ютері, щоб ефективно працювати з безліччю можливих форматів документів.

Ідея вирішення проблеми обміну документами між різними комп'ютерами і додатками через Internet заснована на мові розмітки гіпертексту HTML (HyperText Markup Language). Ця мова була створена більше 15 років тому як стандарт оформлення документів та був прийнятий переважною більшістю користувачів Internet, а головне, - усіма виробниками програмного забезпечення та обладнання для Web. Документи, розмічені відповідно до HTML, можуть читатися на будь-якому комп'ютері, на якому встановлена ​​всього лише одна програма перегляду таких документів - браузер.

Завдяки мові розмітки HTML, клієнт Web може на екрані свого комп'ютера переглянути документ в тому вигляді, в якому його задумав розробник: з певними розмірами шрифту і розбивкою на абзаци, з певним розташуванням малюнків, гіперпосилань і ін.

Текстовий документ, складений на HTML, має розмір в байтах в кілька разів менший, ніж розмір аналогічного документа, підготовленого в текстовому процесорі (наприклад, Word).

В основу розроблюваного мови Бернерс-Лі (розробник) поклав мову SGML і прийоми роботи з гіпертекстом, з чим і пов'язана назва створеного ним мови - HTML. Нова мовавикористовував основні конструкції SGML для опису документів і гіпертекстових посилань.


гіпертекст- це спосіб організації тексту, графіки та інших даних, при якому елементи даних пов'язані між собою. Пов'язаними можуть бути як елементи одного документа, так і елементи різних документів. Гіпертекстова структура лежить в основі World Wide Web.

Гіпертексти представляють собою електронні документи. З гіпертекстами можна працювати тільки на комп'ютері, в друкованому вигляді гіпертексту не існують. Прикладом гіпертекстової системи може служити відома довідкова система ОС Windows.

зв'язкив гіпертекстової структурі здійснюються за допомогою посилань.Завдяки посиланнях, користувач може з одного документа викликати інший документ, з нього наступний документ і т.д.

У 1989 р Бернерс-Лі розробив інформаційну систему, що нагадує путину документів, пов'язаних посиланнями. Документи зберігаються на серверах, які розміщуються по всьому світу і з'єднані між собою каналами Інтернету. він розробив протокол HTTP - мова, на якому сервери повинні обмінюватися гіпертекстовими документами, І написав перші програми Web-сервера і браузера. Він звернувся безпосередньо до Інтернет-спільноти, і ентузіасти в 1991 році почали створювати перші вузли Web.

У наступні роки система World Wide Web стрімко розвивалася, вона стала найпопулярнішою службою в Інтернеті. В даний час вона задовольняє потреби в інформації найширших верств користувачів, включаючи до свого складу мільйони вузлів Web. На великих вузлах розміщуються тисячі і сотні тисяч документів, причому загальна кількість документів в WWW з кожною секундою збільшується, оскільки над їх створенням працює величезна армія фахівців і любителів в різних куточках земної кулі.

World Wide Webабо скорочено Web - це глобальна система поширення гіпертекстової інформації, яка використовує в якості каналів транспортування Інтернет.

Фактично World Wide Web - це гіпертекстове простір документів, що не пов'язане з географією розміщення самих Web-вузлів. Тому в цьому просторі фізичне відстань між вузлами не має сенсу. Ви можете на екрані монітора однаково переглядати Web-сторінки, які зберігаються як на диску комп'ютера в сусідній кімнаті, так і на сервері, розташованому в іншій країні.

World Wide Web функціонує за певними стандартами, які розробляються і впроваджуються об'єднанням дослідних і промислових організацій - консорціумом W3C(Скорочення від World Wide Web Consortium). .

Мова розмітки HTML був заснований на мові SGML. Засоби розмітки абзаців, заголовків, списків і інші елементи наявні в HTML, були передбачені і в SGML. Заслуга винахідника HTML полягає в тому, що він ввів в мову розмітки те, чого не було SGML - це гіпертекстові посилання.

Мова розмітки документів - це набір спеціальних інструкцій, називаних тегами, призначених для формування в документах якоїсь структури і визначення відношень між різноманітними елементами цієї структури. Теги мови, або, як їх іноді називають, управляючі дескриптори, у таких документах виділяються щодо основного вмісту документа і служать у якості інструкцій для програми, що виробляє показ вмісту документа на стороні клієнта. У найперших системах для позначення цих команд використовувалися символи "<” и “>", Усередині яких містилися назви інструкцій та їх параметри. Зараз такий спосіб позначення тегів є стандартним.

Використання гіпертекстової розбивки текстового документа в сучасних інформаційних системах багато в чому пов'язано з тим, що гіпертекст дозволяє створювати механізм нелінійного перегляду інформації. У таких системах дані представляються не у вигляді безперервного потоку текстової інформації, а набором взаємопов'язаних компонентів, перехід за якими здійснюється за допомогою гіперпосилань.

Найпопулярніший на сьогоднішній день мова гіпертекстової розмітки - HTML, був створений спеціально для організації інформації, розподіленої в мережі Інтернет, і є однією з ключових складових технології WWW. З використанням гіпертекстової моделі документа спосіб подання різноманітних інформаційних ресурсів в мережі став більш впорядкований, а користувачі отримали зручний механізм пошуку та перегляду потрібної інформації.

HTML є спрощеною версією стандартного спільної мовирозмітки - SGML (Standart Generalised Markup Language), який був затверджений ISO як стандарт ще в 80-х роках. Ця мова призначений для створення інших мов розмітки, він визначає припустимий набір тегів, їхні атрибути і внутрішню структуру документа. Контроль над правильністю використання дескрипторів здійснюється за допомогою спеціального набору правил, званих DTD-описами, які використовуються програмою клієнта при розборі документа. Для кожного класу документів визначається свій набір правил, що описують граматику відповідної мови розмітки. За допомогою SGML можна описувати структуровані дані, організовувати інформацію, що міститься в документах, представляти цю інформацію в деякому стандартизованому форматі. Але через деяку свою складність, SGML використовувався, в основному, для опису синтаксису інших мов (найбільш відомим з яких є HTML), і мало хто додатки працювали з SGML- документами безпосередньо.

Набагато більш простий і зручний, ніж SGML, мова HTML дозволяє визначати оформлення елементів документа і має якийсь обмежений набір інструкцій - тегів, за допомогою яких здійснюється процес розмітки. Інструкції HTML, в першу чергу, призначені для управління процесом виведення вмісту документа на екрані програми-клієнта і визначають цим самим спосіб представлення документа, але не його структуру. В якості елемента гіпертекстової бази даних, описуваної HTML, використовується текстовий файл, який може легко передаватися по мережі з використанням протоколу HTTP. Ця особливість, а також те, що HTML є відкритим стандартом і величезна кількістькористувачів має можливість застосовувати можливості цієї мови для оформлення своїх документів, безумовно, вплинули на зростання популярності HTML і зробили його сьогодні головним механізмом подання інформації в Web.

Однак сучасні програми потребують не тільки в мові представлення даних на екрані клієнта, але і в механізмі, що дозволяє визначати структуру документа, описувати що містяться в ньому елементи. HTML володіє нескладним набором команд і цілком успішно справляється із завданням опису текстової інформації і відображенням її на екрані програми перегляду - браузера. Однак самі відображаються дані ніяк не пов'язані з тими тегами, які використовуються для форматування, тому у програм-аналізаторів немає можливості використовувати теги HTML для пошуку потрібних нам фрагментів документа. Тобто зустрівши, наприклад, такий опис

rose

програма перегляду буде знати, яким кольором відобразити текст, що міститься всередині тегів і, ймовірно, відобразить його правильно, але їй абсолютно байдуже, в якому місці документа зустрівся цей тег, в які інші теги укладений поточний фрагмент, чи існують вкладені в нього фрагменти, чи правильно побудовані відносини між об'єктами. Таке "байдужість" до структури документа призводить до того, що пошук або аналіз інформації усередині нього нічим не буде відрізнятися від роботи із суцільним, що не розбитим на елементи текстовим файлом. А це, як відомо, не самий ефективний спосіброботи з інформацією.

Іншим істотним недоліком HTML можна назвати обмеженість набору його тегів. DTD-правила для HTML визначають фіксований набір дескрипторів і тому в розробника немає можливості вводити власні, спеціальні теги. Хоча час від часу з'являються нові розширення мови, але довгий шлях їх стандартизації, що супроводжується постійними розбіжностями між основними виробниками браузерів роблять практично неможливою швидку адаптацію мови, його використання для відображення спеціалізованої інформації (наприклад, мультимедійної, математичних, хімічних формулі т.д.).

Підводячи підсумок всьому сказаному, можна стверджувати, що HTML вже сьогодні не задовольняє повною мірою вимогам, що пред'являються сучасними розробниками до мов подібного роду. І йому на зміну був запропонований новий мову гіпертекстової розмітки, потужний, гнучкий, і, одночасно з цим, зручний мова XML.

XML (Extensible Markup Language) - це мова розмітки, що описує цілий клас об'єктів даних, званих XML-документами. Ця мова використовується в якості засобу для опису граматики інших мов і контролю над правильністю складання документів. Тобто сам по собі XML не містить ніяких тегів, призначених для розмітки, він просто визначає порядок їх створення. Таким чином, якщо, наприклад, ми вважаємо, що для позначення елемента rose у документі необхідно використовувати тег ; то XML дозволяє вільно використовувати обумовлений нами тег і ми можемо включати в документ фрагменти, подібні до наступного:

rose

Набір тегів може бути легко розширений. Якщо, припустимо, ми хочемо також вказати, що опис квітки має за змістом йти усередині опису оранжереї, в якій він цвіте, то просто задаємо нові теги і вибираємо порядок їх слідування:

rose

Процес створення XML документа дуже простий і вимагає лише базових знань HTML і розуміння тих завдань, які необхідно виконати, використовуючи XML в якості мови розмітки. Таким чином, у розробників з'являється унікальна можливість визначати власні команди, що дозволяють їм найбільш ефективно визначати дані, що містяться в документі. Автор документа створює його структуру, будує необхідні зв'язки між елементами, використовуючи ті команди, які задовольняють його вимогам, і домагається такого типу розмітки, яке необхідно йому для виконання операцій перегляду, пошуку, аналізу документа.

Ще одним з очевидних переваг XML є можливість використання його в якості універсальної мови запитів до сховищ інформації. Сьогодні в W3C знаходиться на розгляді робочий варіант стандарту XML-QL (або XQL), який, можливо, в майбутньому складе серйозну конкуренцію SQL. Крім того, XML-документи можуть виступати в якості унікального способу зберігання даних, який включає в себе одночасно засоби для розбору інформації й представлення її на стороні клієнта. У цій області одним із перспективних напрямків є інтеграція Java і XML - технологій, що дозволяє використовувати міць обох технологій при побудові машинно-незалежних додатків, що використовують, крім того, універсальний формат даних при обміні інформацією.

XML дозволяє також здійснювати контроль за коректністю даних, що зберігаються в документах, робити перевірки ієрархічних співвідношень усередині документа і встановлювати єдиний стандарт на структуру документів, умістом яких можуть бути самі різні дані. Це означає, що його можна використовувати при побудові складних інформаційних систем, в яких дуже важливим є питання обміну інформацією між різними додатками, що працюють в одній системі. Створюючи структуру механізму обміну інформації на самому початку роботи над проектом, менеджер може позбавити себе в майбутньому від багатьох проблем, пов'язаних з несумісністю використовуваних різними компонентами системи форматів даних.

Також одним з достоїнств XML є те, що програми-обробники XML-документів не складні і вже сьогодні з'явилися і вільно поширюються всілякі програмні продукти, призначені для роботи з XML-документами. XML підтримується в IE5. Було заявлено про його підтримку в наступних версіях Netscape Communicator, СУБД Oracle, DB-2, в додатках MS-Office. Все це дає підстави припускати, що, швидше за все, в найближчому майбутньому XML стане основною мовою обміну інформацією для інформаційних систем, замінивши собою, тим самим, HTML. На основі XML уже сьогодні створені такі відомі спеціалізовані мови розмітки, як SMIL, CDF, MathML, XSL, і список робочих проектів нових мов, що знаходяться на розгляді W3C, постійно поповнюється.

Мова XSLT застосовується для обробки документів, внесення змін і необхідних доповнень до розмітку. Його можна застосовувати для перетворення XML-коду в відформатований HTML-код, легко сприймається людиною. Можна також перетворити XML-документ в простий текст або в інший XML-документ зі зміненою структурою або навіть в документ JavaScript. Мова XSLT отримувати доступ до вмісту XML-документів, а також застосовується для створення нових документів на їх основі. В силу викладених причин варто зайнятися вивченням мови XSL.

Найчастіше виконується перетворення XML-документів в HTML-документи, саме ця операція розглядається в прикладах цього розділу.

Для виконання XSLT-перетворення використовуються два документа: перетворений документ і таблиця стилів, яка визначає саме перетворення. В даному випадку йдеться про XML-документах.

У системах обробки текстів в документ включається додаткова інформація, Звана розміткою і виконує наступні функції:

Виділення логічних елементів даного документа;

Завдання функцій обробки виділених елементів.

У звичайних текстових процесорах існують вбудовані команди включення / вимикання шрифтів і ін., Аналогічні командам управління розміщенням інформації на екрані або при друці (так звані Escape-послідовності).Такий підхід називається командної або процедурної розміткою (табл. 2.1).

Альтернативний спосіб розмітки полягає у виділенні частини тексту без вказівки способу обробки виділення. Потім інші команди призначають фрагментами спосіб обробки. Така розмітка називається описової(Дескриптивної). Вона включає мітки (Tags, таги)початку і закінчення елемента тексту і вказує, як інтерпретувати даний фрагмент.

Змінюючи набір процедур, відповідний описової розмітки, можна змінити зовнішнє уявлення одного і того ж документа. Розвиток ідей описової розмітки призвело до визначення розмітки як формального мови. Це дозволяє перевірити правильність розмітки і мінімізувати її обсяг за рахунок підстановки замовчувань.

Основною перевагою описової розмітки є її гнучкість, оскільки фрагменти тексту відзначені як «ніж вони є» (а не «як вони повинні бути відображені»), причому в майбутньому може бути написано програмне забезпечення для такої обробки цих фрагментів, яка навіть не передбачалася розробниками мов . Наприклад, гіперпосилання HTML, спочатку призначені для навігації користувачами за сукупністю зв'язків в мережі, в подальшому стали використовуватися також механізмами пошуку і індексування в мережі, для оцінки популярності ресурсів і т. Д.

Описова розмітка також полегшує завдання переформатування документа при необхідності, оскільки опис формату не пов'язане зі змістом. наприклад, курсивможе використовуватися або для виділення тексту, які позначки іноземних (або жаргонних) слів, або для інших цілей.

Однак якщо слова просто виділені (дескриптивної або процедурно) як курсив в цій двозначності можна повністю розібратися. Якщо ж ці два випадки були по-різному розмічені на самому початку, кожен може бути переформатований незалежно від інших. Родовидові (generic markup) розмітка - інше найменування для описової розмітки.

Практично елементи різних класів розміток зазвичай співіснують в будь-якої конкретної системі. Наприклад, HTML містить як елементи розмітки, які є процедурними (b для напівжирного шрифту), так і інші, які є описовими ( «blockquote», або «href», - ознака). HTML також включає елемент pre, який обмежує область тексту, яка буде розташована точно так, як надруковано.



Найсучасніші системи описової розмітки розглядають документи як ієрархічні структури (дерева), а також забезпечують деякі засоби для вбудованих перехресних посилань. Тому такі документи можуть трактуватися і оброблятися як бази даних, структура яких досить добре визначена (проте, оскільки вони не мають таких строгих схем, як реляційні бази даних, їх зазвичай називають «слабоструктурированное базами даних»).

З настанням III тисячоліття виник інтерес до документів неієрархічних структур. Наприклад, стародавня і релігійна літературазазвичай має риторичну структуру або структуру прози (оповідання, розділ, параграф і т. д.), а також включає довідкову інформацію (книги, глави, строфи, рядки). Так як кордони цих модулів часто перетинаються, вони не можуть бути повністю закодовані з використанням тільки системи розмітки з деревовидної структурою. Серед систем моделювання Документів, які підтримують такі структури, - MECS, TEI Guidelines, LMNL, і CLIX.

Термін «розмітка» походить від традиційної практики розмітки рукописів перед публікацією (т. Е. Додавання символічних команд на полях і між рядків в паперовій рукописи), протягом багатьох століть це робили працівники видавництва (редактори і коректори) які відзначали, яким шрифтом, стилем і кеглем повинні бути набрані фрагменти тексту, а потім передавали рукопис складачам, які вручну здійснювали набір тексту з урахуванням символів розмітки.



В даний час існує безліч мов розмітки (табл. 2.2), серед найбільш широко відомих - DocBook,

MathML, SVG, Open eBook, XBRL та ін. В основному вони призначені для представлення різних текстових документів але спеціалізовані мови можуть використовуватися в багатьох інших областях. Безумовно, найбільш добре відома мова розмітки HTML (мова розмітки гіпертексту), одна з основ WWW (Всесвітньої павутини).

Розглянемо деякі з систем розмітки.

RUNOFF була першою системою форматування текстів, яка отримала значну популярність. Вона була розроблена в 1964 р для операційної системи CTSS Джеромом X. Салтзером (Jerome H. Saltzer) з використання асемблера MAD.

Продукт фактично складався з пари програм:

TYPSET, який був в основному редактором документів;

RUNOFF - процесор виведення.

RUNOFF здійснював підтримку розбиття на сторінки і розміщення заголовків, а також вирівнювання тексту. RUNOFF - прямий попередник програми форматування документів в ОС Multics, яка в свою чергу була предком програм форматування для ОС Unix (roff і nroff), і їх нащадків. Він був також предком FORMAT для OS / 360 IBM, і звичайно побічно для всіх наступних програм і систем обробки текстів. Назва, як передбачається, виходило з фрази, популярної в той час - I "ll run off a copy.

ТеХ - абревіатура від τεχνη (TEXNH - techne), грецький термін для «мистецтва, ремесла, вміння», джерело для слова «технічний». За англійськи вимовляється «тек» (як в слові technology).

ТеХ - складальна система, створена Дональдом нутом (Donald Knuth). Разом з мовою METAFONT для опису шрифту і Computer Modern typeface (Комп'ютерного Сучасного шрифту) він був спроектований для двох основних цілей - по-перше, представити кожному користувачеві можливість створювати високоякісні книги в межах розумних трудовитрат по-друге, щоб така система давала ідентичні результати на будь-яких комп'ютерах як в даний час, так і в майбутньому. ТеХ - безкоштовне програмне забезпечення, популярне в академічній спільноті, особливо серед математиків, фізиків інформатиків, економістів, і в технічних спільнотах. Воно в значній мірі конкурує з іншим популярним форматізатором ТеХ - Unix troff, і в багатьох інсталяціях Unix вони використовуються спільно.

Визнано, що ТеХ є найкращим шляхом створення і роздруківки складних математичних формул, але тепер воно також використовується для багатьох інших набраних завдань, особливо в формі LaTeX і інших програмних засобів форматування.

Команди ТеХ зазвичай починаються зі зворотним косою риси і групуються в блоки вигнутими фігурними дужками. Однак майже всі синтаксичні властивості ТеХ можуть бути змінені під час виконання програми, що ускладнює обробку входу ТеХ іншими програмами. ТеХ - мова на основі макросів і лексем і багато команд, включаючи найбільш часто визначаються користувачем, розширюються при виконанні, поки не залишаться тільки не розширюється лексеми, які і виконуються.

Базовий варіант ТеХ включає приблизно 300 команд, названих примітивами. Однак ці команди низького рівня рідко використовуються безпосередньо користувачами, більшість функціональних можливостей забезпечується файлами формату (копії пам'яті ТеХ після того, як були завантажені великі набори макрокоманд). Початковий формат Нута (за замовчуванням), який додає приблизно 600 команд, називається Plain ТеХ. Більш широко використовуваним форматом є LaTeX, спочатку розроблений Леслі Лампорта, який включає стилі документа для книг, листів, слайдів і т. Д, а також додає підтримку посилань і автоматичної нумерації формул і розділів.

Інший широко використовуваний формат - AMS-TeX, розроблений Американським математичним суспільством (American Mathematical Society) і передбачає додатково багато дружніх команд, які можуть бути змінені видавництвами, щоб забезпечити їх фірмовий стиль. Більшість особливостей AMS-TeX може застосовуватися в LaTeX при використанні AMS «packages» (що іменується як AMS-LaTeX).

Щоб написати програму друку рядка «Programming» в Plain TeX, необхідно створити файл myfile.tex з наступним змістом:

\ Bye% end of the file; not shown in the final output.

За замовчуванням всі, що слідує за знаком відсотка на рядку, - коментар, ігнорований інтерпретатором ТеХ. Якщо виконати ТеХ на цьому файлі (наприклад, набираючи tex myfile.tex в режимі командного рядка), то буде створений вихідний файл з ім'ям myfile.dvi, який представляє вміст сторінки в незалежному від пристроїв форматі (Device Independent Format - DVI). Результати можуть або бути надруковані безпосередньо програмі перегляду інтерактивної цифрової відеосистеми або перетворені в більш загальний формат, типу PostScript, використовуючи програму dvips. Такі варіанти ТеХ, як PDFTeX, безпосередньо виробляють файли формату PDF.

Розглянемо форматування математичної формули. Наприклад, щоб написати відомий вислів для кореня квадратного рівняння, можна ввести:

The quadratic formula is $ -b \ pm \ sqrt (b ^ 2 - 4ac) \ over 2a $ \ bye

Це призведе до висновку наступного тексту:

Кілька систем обробки документів засновані на ТеХ, особливо jadeTeX, який використовує ТеХ як внутрішній для того, щоб друкувати з виходу James Clark "s DSSSL Engine, і Texinfo, обробник документації системи GNU. ТеХ був офіційним складальним пакетом для операційної системи GNU з 1984 р .

Відомі численні розширення і супутні програми для ТеХ, серед них BibTeX для бібліографії (поширюється спільно з LaTeX), PDFTeX, який обходить формат DVI і здійснює прямий висновок в Adobe Systems "Portable Document Format (pdf), і Omega, яка дозволяє ТеХ використовувати набір символів Unicode. Більшість розширень ТеХ може бути отримано безкоштовно у всебічної Мережі архівів ТеХ (Comprehensive ТеХ Archive Network - CTAN). ТеXmacs - редактор наукової літературина основі ТеХ, підтримує режим повної відповідності (WYSIWYG) і призначений щоб бути сумісним з ТеХ і Emacs.

У багатьох технічних областях, таких як прикладна інформатика, математика та фізика, ТеХ став фактичним стандартом. Багато тисяч книг були видані, використовуючи ТеХ, такими видавництвами, як Addison-Wesley, Cambridge University Press, Elsevier, Oxford University Press or Springer. Численні журнали в цих областях проведені з використанням ТеХ мул LaTeX, причому авторам дозволено представляти рукописи в форматі ТеХ.

Починаючи з версії 3 ТеХ використовував специфічну систему нумерації версій, де поновлення позначалися за допомогою додаткової цифри до десятковому числутак, щоб номер версії асимптотично наближався до л. Це - відображення того факту, що ТеХ є дуже стійким і очікуються тільки незначні оновлення. Поточна версія ТеХ - 3.141592; це було останнє оновлення в грудні 2002.

Надіслати свою хорошу роботу в базу знань просто. Використовуйте форму, розташовану нижче

Студенти, аспіранти, молоді вчені, які використовують базу знань в своє навчання і роботи, будуть вам дуже вдячні.

подібні документи

    Визначення поняття гіпертексту. Основні частини документа SGML. Історія створення стандартного мови розмітки документів HTML. Відмінності синтаксису XHTML від HTML. RSS - сімейство XML-форматів для опису стрічок новин. Застосування мови розмітки KML.

    презентація, доданий 15.02.2014

    Основи мови програмування Web-сторінок - HTML. Види інформації, яку може містити Web-сторінка: текст, графіка, звук, анімація і відео. Інструментарій для створення Web-сторінок. Основні HTML-редактори, які використовуються для Web-дизайну.

    реферат, доданий 19.01.2011

    Загальна характеристикамови розмітки гіпертексту Hypertext Markup Language. Структура HTML-документа. Огляд основних можливостей HTML. Елементи сучасного дизайну Web-сторінок. Аналіз практичного застосування HTML (на прикладі навчальних програм).

    курсова робота, доданий 24.11.2012

    Основні теги і атрибути мови HTML. Створення web-сайту, який повинен представляти собою кілька пов'язаних між собою сторінок. Розгляд різних значень атрибутів і тегів на сторінках і в інших документах. Екранні форми розроблених сторінок.

    лабораторна робота, доданий 16.04.2014

    Що таке розмітка. Мова розмітки як набір угод про принципи форматування, які застосовуються для кодування текстових блоків. Можливості форматів SGML, HTML, XML, історія створення, специфіка застосування, контроль над розміщенням інформації.

    реферат, доданий 22.03.2010

    Нова мова розмітки гіпертексту XHTML. Валідація XHTML-документів, визначення їх типу. Поширені помилки в XHTML-розмітки. Конформність користувацьких агентів. Використання XHTML з іншими просторами імен. Розширення семантики HTML.

    курсова робота, доданий 14.07.2009

    Вивчення алгоритму рекурсивного спуску і системи побудови граматики за допомогою лексичного аналізатора Lex. Написання програми інтерпретатора мови розмітки HTML. Перевірка вхідної послідовності на коректність входу як загальна функція програми.

    контрольна робота, доданий 25.12.2012

Термін «розмітка» походить від традиційної практики розмітки рукописів перед публікацією (тобто додавання символічних команд на полях і між рядків в паперовій рукописи).

Протягом багатьох століть це робили працівники видавництва (редактори і коректори) які відзначали, яким шрифтом, стилем і кеглем повинні бути набрані фрагменти тексту, а потім передавали рукопис складачам, які вручну здійснювали набір тексту з урахуванням символів розмітки.

Мова розмітки- це набір спеціальних інструкцій, називаних тегами (tags), що виконують такі функції:

      завдання функцій обробки виділених елементів;

      виділення логічних елементів даного документа.

Завдання функцій обробки виділених елементів

У текстових процесорах існують вбудовані команди включення / вимикання шрифтів і інше, аналогічні командам управління розміщенням інформації на екрані або при друці. Такий підхід називається командноїабо процедурної розміткою.

Приклади процедурної розмітки

Виділення логічних елементів документа

Служить для формування в документах якоїсь структури і визначення відношень між різноманітними елементами цієї структури без вказівки способу обробки. Така розмітка називається описової.

Змінюючи набір процедур, відповідний описової розмітки, можна змінити зовнішнє уявлення одного і того ж документа.

описова розмітка

Основною перевагою описової розмітки є її гнучкість, оскільки фрагменти тексту відзначені як «ніж вони є» (а не «як вони повинні бути відображені»).

В майбутньому може бути написано програмне забезпечення для такої обробки цих фрагментів, яка навіть не передбачалася розробниками мов. Наприклад, гіперпосилання HTML, спочатку призначені для навігації користувачами за сукупністю зв'язків в мережі, в подальшому стали використовуватися також механізмами пошуку і індексування в мережі, для оцінки популярності ресурсів і так далі.

Приклади мов розмітки

Мови розмітки використовуються всюди, де потрібно висновок тексту фіксованої:

    в друкарні (SGML, TeX, PostScript, PDF),

    призначених для користувача інтерфейсів комп'ютерів (MicrosoftWord, OpenOffice, troff),

    Всесвітній Мережі (HTML, XHTML, XML, WML, VML, PGML, SVG, XBRL).

Тегів структура мови розмітки

Розвиток ідей описової розмітки призвело до визначення розмітки як формального мови.

Теги мови (керуючі дескриптори) певним чином кодуються (виділяються щодо основного вмісту документа) і служать в якості інструкцій для програми, що виробляє показ вмісту документа на стороні клієнта.

У багатьох сучасних мовах для позначення цих команд (теги мови) використовувалися символи< и >, Усередині яких містилися назви інструкцій та їх параметри (HTML і XML). В SGML можна призначати інші символи для обрамлення тега (наприклад, фігурні дужки). Крім того, існують різні системи мов-підмножин, які використовуються, з меншими можливостями, наприклад на веб-форумах і дошках оголошень використовується мова розмітки BBCode, теги якого обмежуються символами квадратних дужок:.

Тегів модель описує документ як сукупність контейнерів, кожен з яких починається і закінчується тегами. У більшості випадків теги використовуються парами. Пара складається з відкриває (start tag) і закриває (end tag) тегів.

Синтаксис відкриваючого тега:<имя_тега [атрибуты]>

Ім'я закриває тега відрізняється від імені відкриває лише тим, що перед ним ставиться похила риса:

Атрибути визначають додаткові характеристики елемента. Атрибути тега записуються в наступному форматі: ім'я [= "значення"]. Для деяких атрибутів значення може не вказуватися. У закриває тега атрибутів не буває.

Дія будь-якого парного тега починається з відкриваючого тега і закінчується при зустрічі відповідного закриває тега.

Пару, що складається з відкриває і закриває тегів, називають контейнером, а частина тексту між ними, - елементом.

Тема 1 рівня

Тема 2 рівня

Залежно від використовуваної мови розмітки додатково можливе застосування одиночного тега і тега порожнього елемента. Ім'я тега визначає тип елемента.

Синтаксис одиночного тега:<имя_тега [атрибуты] />

У деяких мовах розмітки імена тегів заздалегідь визначені (HTML). В інших не регламентуються жорстко, тобто користувачі можуть вводити і використовувати нові теги (XML). Наприклад, тег «persona» можемо визначити тип цього XML елемента, як прізвище ім'я та по батькові. Іванов Іван Іванович

В SGML елементи можуть перетинатися, тобто в SGML можлива така послідовність тегів:

У XML елементи мають строгу синтаксичну структуру, тобто бути строго вкладеними один в одного і завжди закриватися:

Крім того, в SGML, HTML вони не зобов'язані бути закритими:

Практично у всіх мовах розмітки документів значення атрибута інтерпретується як текстове. Значення атрибута прийнято брати в лапки.

Примітка:

Документ, написаний з використанням мови розмітки, містить не тільки сам текст (як послідовність слів і знаків пунктуації), але і додаткову інформацію про різні його ділянках - наприклад, вказівку на заголовки, виділення, списки і т. Д.

Тобто документ являє собою не що інше, як звичайний АSСII-файл, з доданими до нього керуючими кодами (тегами).