Заняття 4. Бібліографічні формати та структура запису в електронному каталозі
Основним елементом інформаційно-бібліотечної системи є бібліографічний запис, мова якого реалізує в електронному середовищі комунікативну функцію між запитом користувача і змістом бібліографічної інформації.
Основою бібліографічного запису є бібліографічний опис документа, який формується в процесі створення каталогу. Не можна ставити знак рівності між бібліографічною карткою і машиночитним бібліографічним записом, між картковими і електронним каталогом. Правила заповнення елементів даних і визначення необхідних зв'язків - це правила складання бібліографічного опису, а сукупність взаємопов'язаних елементів даних, яка служить для створення і обміну бібліографічними записами в машиночитній формі – це бібліографічний формат. Всі формати містять ряд елементів, правил, а іноді і зв'язків, не передбачених стандартами і правилами складання бібліографічних описів.
Ідея створення бібліографічного формату народилася, коли рівень розвитку обчислювальної техніки дозволив створювати найпростіші електронні каталоги. Історія розвитку MARC-форматів нараховує більше п’ятдесяти років. Зародження машиночитного каталогізування (Machine-Readable Catalogue або Cataloging – MARC) пов’язане з Бібліотекою Конгресу США, яка в 1960 р. вже мала в своєму арсеналі комп’ютери, за допомогою яких було можливо створювати машиночитні записи.
Слідом за Сполученими Штатами створюють свої формати й інші країни. У процесі використання формату в 1970-х рр. з’явилося понад 20 його різних версій, орієнтованих на національні правила каталогізування (в тому числі UKMARC, INTERMARC, USMARC, AUSMARC, CANMARC, DanMARC, LCMARC, NоrMARC, SwaMARC та ін.). Відповідно, MARC перетворюється в USMARC. Всі ці формати мали багато спільного, оскільки будувалися на єдиній, MARCівській основі, але й різнилися між собою, тому що враховували не лише правила, а й традиції каталогізування, відмінності у поглядах на можливості електронного каталогу і вимоги до нього. В результаті стало неможливим здійснювати обмін інформацією між системами, що використовують різні формати. Для подолання несумісності MARC-форматів на рівні ІФЛА було прийнято рішення про розробку формату-посередника, який отримав назву UNIMARC, тобто «Універсальний MARC». Для реалізації процесу обміну кожній національній службі достатньо було скласти два конвертори: один для конвертування в UNIMARC, інший - з UNIMARC.
У 1990-ті рр. відбувається подальше зростання кількості MARC-форматів - їх нараховується вже понад п’ятдесят. До числа нових, розроблених на базі UNIMARC, можна віднести RUSMARC (Росія), BELMARC (Республіка Білорусь) та інші. Появу такої кількості форматів можна пояснити не тільки і не стільки особливостями національних правил каталогізування в різних країнах, скільки питаннями престижу. В двох словах можна визначити алгоритм розробки національних форматів: як базовий береться USMARC або UNIMARC, потім здійснюється його прив'язка до національних правил каталогізування.
Європейський Союз визнає формат UNIMARC як офіційний обмінний формат країн, членів ЄС. Отже, UNIMARC стає фактично єдиним міжнародно-визнаним комунікативним форматом.
В цей же час постає питання узгодження правил і форматів між країнами. Перший крок в цьому напрямку – узгодити формати для країн, що працюють за одними і тими ж правилами каталогізування. Планувалися наступні учасники: США, Великобританія, Канада, Австралія і Нова Зеландія, але реальна робота проводилася тільки за участю США і Канади. У цей час з'являється назва IMARC (International MARC). В даний час цей формат отримав назву MARC21 з очевидною претензією на 21 століття. Але зміна назви формату викликана не якісною зміною самого формату, а лише зміною сфери його поширення.
MARC-формати визначають структуру і семантику бібліографічної інформації, це насамперед стандарт структури даних, а не стандарт змісту. Розглянемо це на прикладі формату MARC 21.
Як система MARC 21 складається з 5 узгоджених між собою форматів: «MARC 21 формат для бібліографічних даних», «MARC 21 формат для авторитетних даних», «MARC 21 формат для класифікаційних даних», «MARC 21 формат для суспільної інформації» та «MARC 21 формат для даних про місце утримання».
MARC-запис базується на трьох основних елементах: структура запису, позначення змісту та зміст елементів даних запису.
Структура запису обумовлена міжнародним стандартом «Формат для обміну інформацією (Format for Information Exchange) (ISO 2709)» та його додатком «Бібліографічний взаємообмін інформацією (Bibliographic Information Interchange) (ANSI Z39.2)».
Позначення змісту – коди та домовленості, що встановлені спеціально для ідентифікації та подальшої характеристики елементів даних у записі, а також для підтримки обміну даними.
Зміст елементів даних, що складають MARC-запис, визначається стандартами, такими як ДСТУ ГОСТ 7.1:2006 «Бібліографічний запис. Бібліографічний опис. Загальні вимоги та правила складання (ГОСТ 7.1-2003, IDT)», «Міжнародний стандарт бібліографічного опису (International Standard Bibliographic Description) (ISBD)», «Англо-американські правила каталогізації (Anglo-American Cataloguing Rules) (AACR 2)», «Предметні заголовки Бібліотеки Конгресу (Library of Congress Subject Headings) (LCSH)» чи інші правила каталогізації, предметні тезауруси та класифікаційні таблиці, що використовуються організацією, яка створює запис.
«MARC 21 формат для бібліографічних даних» призначений для передачі бібліографічної інформації про друковані та рукописні текстові матеріали, комп’ютерні файли, карти, музичні твори, ресурси, що продовжуються, візуальні матеріали та змішані матеріали.
Запис у форматі MARC 21 складається з Лідера запису, Довідника та Змінних полів.
Лідер (Leader) – перше та обов’язкове поле в MARC-записі, що складається з позиційно визначених елементів даних (чисел і кодів), що надають інформацію, необхідну для автоматизованої обробки запису. Лідер має фіксовану довжину, яка складає 24 символьні позиції.
Довідник (Directory) – серія введень, що містить мітку (тег), довжину та початкове місце розміщення кожного змінного поля у записі. Довжина кожного введення містить 12 символьних позицій.
Змінні поля – решта полів, у яких організовані дані в MARC-запису. Дані розподілені за полями змінної довжини, кожне з яких ідентифіковане міткою поля, що складається з трьох цифр і зберігається в статті Довідника для цього поля. Існує два типи полів змінної довжини:
• Змінні контрольні поля – 00X поля. Ці поля визначаються міткою поля в Довіднику, але вони не містять позицій індикаторів і кодів підполів.
• Поля змінних даних – решта змінних полів - 1XX-9XX. Додатково до позначення міткою поля в Довіднику, поля змінних даних містять також дві позиції індикаторів, що розміщуються на початку кожного поля, і двосимвольний код підполя, що передує кожному елементу даних у середині поля.
Поля змінних даних згруповано в блоки за першим символом мітки поля, що визначає функцію даних усередині запису. Тип інформації в полі визначається двома останніми символами мітками поля.
0XX ПКонтрольна інформація, ідентифікаційні та класифікаційні номери і т.п.
1XX ПОсновні пошукові ознаки (заголовки, точки доступу)
2XX ППоля назв та відомості, що відносяться до назви
3XX ПКількісна/фізична характеристика
4XX ПВідомості про серію
5XX ППримітки
6XX ППоля предметного доступу
7XX ПДодаткові пошукові ознаки (точки доступу)
8XX ПДодаткові пошукові ознаки (точки доступу) на серію та ін..
9XX Поля локального використання
Індикатори (позиції індикаторів) - це перші дві позиції символів в полях даних змінної довжини, що містять значення, які інтерпретують або доповнюють дані, що знаходяться в полі. Значення індикаторів в першій і другій позиціях прописується кожному індикатору окремо. Значення індикаторів можуть бути представлені цифрами або маленькими буквами латинського алфавіту. Пробіл, що позначається символом #, використовується, якщо позиція індикатора не визначена. У полях змінних даних пробіл може відображати як певне значення, так і те, що індикатор для цього поля не визначено.
Коди підполів - це два символи, за допомогою яких усередині поля розрізняються елементи даних (наприклад: назва, продовження назви, відповідальність тощо). Код підполя складається з роздільника (в MARC 21 – це знак $) та наступним за ним ідентифікатором елементу даних (a, b, c, h тощо). Ідентифікатори позначаються маленькими буквами латинського алфавіту або цифрами. Коди підполів визначаються для кожного поля окремо. Там де це можливо, дотримується однорідність їх значення (наприклад, в полях 100, 600, 700 для імен осіб). Порядок вживання підполів зазвичай визначається діючими стандартами та правила каталогізації.
Повторюваність поля та підполя визначається форматом і залежить від характеру представлених даних. Повторюваність чи неповторюваність поля або підполя позначається знаками (П) та (НП) після назви кожного поля або підполя. Наприклад, запис може містити тільки одне 1XX поле, поле 100 може містити тільки одне підполе $a (Ім’я особи), але може містити більш ніж одне підполе $c (титули, звання та інші слова, що асоціюються з іменем).
Технологічні інструкції налаштування в програмному забезпеченні «МАРК-SQL»
В програмному забезпеченні «МАРК-SQL» можна каталогізувати наступні типи матеріалів:
- Книги (BK) – текстові матеріали, які за своїми характеристиками є монографічними.
- Ресурси, що продовжуються (SE) – текстові матеріали, які мають періодичну модель видання, наприклад: журнали, газети, щорічники.
- Комп’ютерні файли (CF) – комп’ютерне програмне забезпечення, цифрові дані, комп’ютерні мультимедійні засоби, он-лайнові системи чи сервіси. Інші види електронних ресурсів ідентифікуються у відповідності до їх найвизначальнішого аспекту: текстовий матеріал, музичний звукозапис, немузичний звукозапис тощо.
- Карти (MP) – усі типи картографічних матеріалів, включно з атласами та глобусами, в друкованому, рукописному, електронному вигляді тощо.
- Музичні твори (MU) – друковані, рукописні музичні твори та мікроформи музичних творів. А також музичні та немузичні звукозаписи.
- Візуальні матеріали (VM) – проекційні зображення, двовимірна графіка, трьохвимірні штучні чи природні об’єкти та комплексні матеріали. Використовується для архівних візуальних матеріалів, якщо їх формат чи носій мають особливе значення.
- Змішані матеріали (MX) – у першу чергу, архівні та рукописні зібрання матеріалів змішаних форм.
Також виділяється бібліографічний рівень документу: стаття (мон), стаття (сер), монографія, добірка, періодика.
Тип матеріалу та бібліографічний рівень прописуються в шаблонах, що визначають перелік полів формату, при створенні/редагуванні різних видів бібліографічних записів. Шаблони формуються у модулі «Адміністратор», режим «Сервіс - Шаблони», та зберігаються у файлі налаштування Patterns.ini (папка bin).
При необхідності в модулі «Каталогізатор» в режимі створення/редагування запису тип матеріалу та бібліографічний рівень можна змінити, скориставшись випадаючими даними з довідників «Тип запису» та «Бібліографічний рівень». Значення довідників прописані у файлі Marc.ini (папка bin) секції [Document].
При створенні аналітичного запису з періодичних видань обов’язково слід визначати тип запису - текстовий матеріал, та бібліографічний рівень - стаття (сер.). Від цих налаштувань буде залежати формування каталожної картки.
Короткий опис всіх полів та підполів формату MARC 21 міститься в таблиці TAG кожної бази даних, яку можна переглянути засобами ACCESS або MS SQL.
Користувачі програмного забезпечення можуть самостійно добавляти, змінювати (згідно вимог формату), вилучати описи полів в режимі «Екранна форма DBList» (модуль «Каталогізатор», режим «Вигляд – Екранні форми - Список полів MARC 21».
Кожний запис таблиці TAG описує поле або підполе. Якщо запис описує поле в цілому, то код підполя має стояти 0. Якщо описано будь-яке підполе, то обов’язково прописується ідентифікатор елементу даних підполя.
В цьому ж режимі прописується повторюваність чи неповторюваність поля або підполя. Можуть повторюватися або поля в цілому, або окремі підполя. При описі в таблиці TAG для кожного поля/підполя позначається ознака повторюваності. При створенні або редагуванні документів повтор поля/підполя здійснюється по правій клавіші миші.
При створенні документів велике значення має використання індикаторів. Налаштування індикаторів здійснюється в файлі IndDesc.ini (папка bin). З початку файлу подається перелік полів з індикаторами, які присвоюються при створенні документів за замовчуванням, далі по кожному підполю подано перелік індикаторів, які вибираються в залежності від документу, що описується. При редагуванні документів індикатори за замовчуванням не проставляються, їх потрібно вибирати із запропонованого довідника.
В модулі «Каталогізатор» в режимі «Вигляд» можна налаштовувати параметри: «Показувати код поля», «Показувати ім’я поля», «Показувати індикатори». За замовчуванням ці параметри позначені «галочками», що означає – виводити ці дані для перегляду.