Національна бібліотека України для дітей
     
Віртуальна довідка1
Наша адреса:
03190, Київ, вул. Януша Корчака, 60
 
Написать письмо
 
 
 
   
Пошук по сайту  
 
Пропустить Навигационные Ссылки.
Про бібліотеку
Послуги та сервіси
Електронні ресурси
Вибрані інтернет-ресурси
Це важливо знати
На допомогу бібліотекареві

Предметизація документів — інформаційне ядро електронного каталогу

Процеси технічної та технологічної революції, що відбуваються у бібліотеках на сучасному етапі, найбільше торкаються сфери каталогізування та обробки інформації. Недарма активне просування комп’ютеризації у більшості бібліотек почалося зі створення електронних каталогів (ЕК), що розкривають склад та зміст їхніх фондів. З впровадженням АІБС, створення електронних каталогів (ЕК) та бібліографічних баз даних (БД) насамперед постало питання забезпечення досконалого тематичного інформаційного пошуку. Для дитячої бібліотеки особливо важливим є надання користувачам необхідної та релевантної інформації, що можливо лише за умови наближення інформаційно-пошукових запитів до природної мови, взаємодії систематичного і предметного принципів розкриття інформації.

Процес вираження змісту документа або запиту на інформаційно-пошуковій мові — це індексування. Він являє собою не опис документа як фізичного об’єкта (створення бібліографічного опису, визначення виду, носія інформації тощо), а є його інтелектуальним аналізом, тобто розкриває його зміст за допомогою систем класифікації, тезаурусів, словників предметних рубрик, авторитетних файлів.

Сьогодні існує багато інформаційно-пошукових мов (ІПМ), що різняться за своїм призначенням та принципами побудови. Інформаційно-пошукові мови, що базуються на різноманітних класифікаціях — це ІПМ класифікаційного типу. Вони призначені для індексування документів та інформаційних запитів на основі індексів класифікаційних систем — ББК, УДК, ДКД, ГРНТІ тощо. Усі ІПМ класифікаційного типу характеризуються рядом властивостей, що ускладнюють їх використання в інформаційному пошуку, особливо із застосуванням технічних засобів. Серед них — неможливість розробки повної та детальної схеми класифікації, трудомісткість використання при індексуванні та координації індексів і назв рубрик. Усе це призвело до створення мов вербального типу — предметизаційної та дескрипторної. Предметизаційна мова призначена для індексування документів та інформаційних запитів за допомогою предметних рубрик. В основу предметизаційної мови покладено алфавітний перелік предметних рубрик, що представляють уніфіковані короткі формулювання теми природною мовою. Дескрипторна мова служить для координатного, або як його ще називають, «вільного» індексування документів та запитів за допомогою дескрипторів і/або ключових слів. В основі дескрипторних ІПМ лежить алфавітний перелік лексичних одиниць. Вони дозволяють досить детально та багатоаспектно розкривати зміст документів. Дескриптори та ключові слова легко доповнюються, поновлюються, оскільки в алфавітний перелік можна включити будь-яку лексичну одиницю, необхідну для індексування. Крім того в автоматизовану технологію широко ввійшли до вжитку мова бібліографічного опису, об’єктноознакові та фактографічні пошукові мови. Оскільки кожна з існуючих ІПМ забезпечує виконання визначених завдань і має разом з перевагами і певні недоліки, в електронних каталогах доцільно використовувати декілька інформаційно-пошукових мов.

При розкритті змісту джерелом вивчення має бути документ в цілому: спочатку ми оцінюємо інформативність елементів бібліографічного опису, анотації, передмови та післямови, змісту видання, а потім обов’язково знайомимось з текстом. Звичайно для розкриття тематичного змісту документа ідеальним є прочитання його повного тексту, але на практиці це просто нереально. Разом з тим індексатор, враховуючи читацькі запити, вікові особливості дитячої аудиторії та диференційований підхід до обслуговування різних груп користувачів, має бути впевненим, що цінна інформація не пропущена, а буде знайдена та використана за призначенням. На процес індексування документа і встановлення загальної методики його виконання поширюється «ДСТУ 2395-2000 (ISO 5963:1985 Інформація та документація. Обстеження документа, встановлення його предмета та відбір термінів індексування. Загальна методика».

Процес індексування можна представити у вигляді наступних операцій. Переглядаючи документ, індексатор визначає його основну тему, а також порушені в ньому другорядні питання, що можуть становити інтерес для конкретної групи користувачів. Потім складається уявна анотація на документ, яка включає ключові слова, що характеризують його зміст. Далі ключові слова замінюються лексичними одиницями інформаційно-пошукових мов (ІПМ): класифікаційними індексами та предметними рубриками. У результаті ми отримуємо пошуковий образ документа інформаційно-пошуковою мовою.

У дитячих бібліотеках сьогодні зазвичай застосовують три методики індексування видань та їхніх складових:
1) систематизацію — визначення класифікаційного індексу документа відповідно до його змісту за таблицями бібліотечно-бібліографічної класифікації — ББК або універсальної десяткової класифікації — УДК;
2) предметизацію визначення предметних рубрик відповідно до змісту документа за допомогою тезаурусів або рубрикаторів;
3) координатне індексування — перелік ключових слів, що додатково розкривають більш вузькі аспекти змісту документа.

Одним із найважливіших процесів індексування є предметизація документів. Він традиційно складається з декількох операцій:
- аналіз змісту і форми документа з метою визначення предмету, аспектів його розгляду і виявлення зв’язку між ними;
- визначення основних змістовних термінів, представлених в тексті, і формулювання з них рубрик, що відображають виявлені зв’язки;
- уніфікація формулювання рубрик за допомогою словників предметних рубрик, тезаурусів;
- редагування рубрик, тобто перевірка їх відповідності правилам предметизації та нормативним документам, що прийняті бібліотекою або корпорацією.

Практика роботи показує, що у спектрі бібліографічних запитів, найбільшу групу становлять тематичні. Саме тому користувачі зацікавлені у предметизації документів, оскільки завдяки цьому процесу зміст документів виражається поняттями природної мови. Користувачам не потрібні спеціальна бібліографічна підготовка, знання класифікаційних таблиць — вони в змозі самостійно знайти необхідну різнобічну інформацію про предмет. Предметні рубрики служать довідником, що орієнтує читача в системі понять галузі, що його цікавить, а наявність ієрархічних посилань дає можливість вибрати потрібний аспект теми. Крім того, предметизація виявляється дуже корисною для тих читачів, інформаційні потреби яких не виражені досить чітко.

Перш за все, бібліотека, яка здійснює предметизацію, повинна мати перелік аспектів, що є найбільш важливими при розкритті змісту документа. Зазвичай до них відносять:
- предмет (тема, поняття), про який йде мова в документі (наприклад, фізика, хімія, банківська справа, літаки, читання тощо);
- географічну рубрику або підрубрику — територія, де відбуваються події (наприклад, Україна, Мінськ, Дніпро (ріка), Подільський район);
- хронологічну підрубрику — час, коли відбуваються події (наприклад, 18 ст., 2005 р.);
- персоналію — в цій ролі може виступати особа (Грушевський Михайло Сергійович), певна організація (Організація Об’єднаних Націй, Верховна Рада, Києво-Печерська лавра, Національна бібліотека України для дітей), певний захід (67 сесія IFLA) або рукописний твір, манускрипт, періодичне видання, театральна або кінопостановка (Біблія, Коран, «Голос України», «Богдан Хмельницький» (кінофільм));
- професію, коли подана характеристика професії, як у науково-пізнавальній, так і художній формі, сценарії щодо відзначення професійних свят;
- жанр — основну форму викладу тексту документа (література, критика, сценарії, довідкові видання, методичні матеріали, офіційні видання тощо);
- примітку про цільове призначення — читацьку аудиторію, яка може використовувати відповідний документ.

Розглядаючи питання предметизації документів, завжди слід пам’ятати: якими б потужними не були сучасні комп’ютери, без правильної організації технології предметизації АІБС буде працювати не ефективно. Досягти уніфікації представлення лексичних одиниць допомагають марк-формати — перелік спеціально розроблених полів для створення бібліографічних записів у машиночитній формі. У дитячих бібліотеках України створення ЕК сьогодні базується на методиці форматів MARC 21, UNIMARC та RUSMARC. Поля предметного доступу зібрані у 6ХХ блоці марк-форматів, де представлено інформацію про тематичне розкриття змісту документу, а також у 5ХХ блоці (МАРК21) — примітках, де вказується читацьке призначення. Приклади застосування даних блоків полів представлено у додатку № 1 «Предметизація документів на основі марк-форматів MARC21 та RUSMARC (російська версія UNIMARC». У додатку № 2 «Перелік категорій предметних заголовків» вміщено список найбільш вживаних найменувань категорій понять з посиланням до відповідних полів, де використовуються ці терміни в якості основної пошукової ознаки.

Вступаючи до інформаційного простору сучасного світу, кожна країна повинна потурбуватися про лінгвістичне забезпечення предметного пошуку реалій своєї історії, культурних, інтелектуальних і духовних здобутків. У 1992 році паралельно з впровадженням АІБС фахівцями Національної бібліотеки України для дітей (НБУ для дітей), було розроблено політематичний інформаційно-пошуковий тезаурус (ІПТ), що досі є основою для предметизації документів і дозволяє уніфікувати подання предметних рубрик — поле 650 (МАРК21) та 606 (UNIMARC та RUSMARC). Інформаційно-пошуковий тезаурус — живий організм, який постійно структурно вдосконалюється та наповнюється новими термінами.

При розробці тезаурусу враховувались три основні компоненти: споживач інформації, який формулює свої запити; інформаційний масив, в якому зосереджена необхідна інформація та інформаційно-бібліотечна система, яка є посередником між споживачем та інформаційним масивом. Було прийнято рішення створити ІПТ, який, з одного боку, максимально відповідав би найбільш різноманітним і неочікуваним запитам читачів, з іншого — максимально розкрив би зміст усіх наявних у бібліотеці документів. Інформаційно-пошуковий тезаурус є політематичним. Його головною особливістю є врахування специфіки вікових особливостей користувачів-дітей та напрямків обслуговування організаторів дитячого читання (питання вивчення предметів шкільної програми, методична література на допомогу школі, питання організації дитячого дозвілля; питання дитячої літератури і дитячого читання).

Усі лексичні одиниці в ІПТ подаються в наступній формі:
- іменники, що позначають обчислювальні предмети, представлено у називному відмінку множини («КНИГИ», «ПЛАЗУНИ», «ЛІТАКИ»);
- іменники, що позначають не обчислювальні об’єкти, представлено у називному відмінку однини («ІСТОРІЯ», «МИСТЕЦТВО», «ЗООЛОГІЯ»);
- для всіх словосполучень, включаючи словосполучення з ім’ям власним, використовується природний (прямий) порядок слів («НОВА ІСТОРІЯ», «ХУДОЖНЯ САМОДІЯЛЬНІСТЬ», «ДИТЯЧІ БІБЛІОТЕКИ»);
- загальновживані абревіатури (ББК, ГПО) входять до ІПТ як предметні рубрики. Кожна з них у словниковій статті представлена розшифровкою, що служить ключовим словом, синонімічним абревіатурі;
- для усунення неоднозначності чи уточнення значення лексичних одиниць використовуються релятори, що є невід’ємною частиною рубрики і відносить його до визначеної предметно-тематичної області. Релятори приводяться в круглих дужках біля предметної рубрики, до якої вони відносяться («Акція (дія) — «Акція (економічне поняття)»).

Зараз тезаурус нараховує близько 5000 словникових статей, що включають тематичні поняття, поєднані між собою вертикальними та горизонтальними зв’язками і призначений для організації пошуку інформації шляхом індексування документів і/чи запитів. Основою для формування предметної рубрики може слугувати будь-яка тематична рубрика на будь-якому рівні ієрархічної залежності, якщо в цьому виникає потреба. Можливі переміщення, зміна підлеглості гніздових рубрик. Дозволяється уточнення формулювань самих рубрик при врахуванні специфіки читацьких запитів за допомогою підрубрик. Кожному запису документа в електронному каталозі бібліотеки присвоюється певний набір рубрик природною мовою, який розкриває його тематичний зміст з урахуванням географічного, хронологічного аспектів та підрубрики. Чітке використання предметних рубрик перш за все є запорукою успішного пошуку.

Створений ІПТ у процесі обробки документів та обслуговування користувачів постійно доповнюється, змінюється, удосконалюється. Знаходячи зернини корисної інформації, використовуючи власний досвід, ми відшліфовуємо те, що вже напрацьовано, принагідно поповнюючи ІПТ новими поняттями.

Крім нормалізованої лексики (індексів УДК і ББК, тематичних і предметних рубрик) у процесі створення бібліографічних записів ЕК застосовується і мова ключових слів. Ключові слова при тематичному розкритті змісту документа використовують в основному для уточнення предметних рубрик: розширюють або звужують їх значення. Словники ключових слів на відміну від інших ІПМ є ненормованими, індексування на їх основі ще називають «вільне індексування». Метод індексування і подальшого пошуку за ключовими словами має ряд недоліків, найсуттєвіші з яких:
- накопичені в процесі роботи ключові слова не аналізуються;
- включаються нестандартизовані терміни, які не завжди адекватно відбивають сутність «предмета»;
- не відображені багатозначність понять і термінів;
- не зазначені смислові (ієрархічні) зв’язки між термінами, а абеткова послідовність термінів посилює цей недолік, віддаляючи один від одного споріднені поняття.

Таким чином, ми маємо значні масиви бібліографічної інформації, але не можемо гарантувати нашим користувачам якісний повноцінний пошук.

У деяких випадках в одному і тому ж документі одночасно розкриваються дві і більше тем, що знаходяться в межах індексованої предметно-тематичної області. При цьому кожну тему слід розглядати самостійно. Тобто пошуковий образ документа може складатися з однієї лексичної одиниці ІПМ, у цьому випадку застосовується найпростіший метод індексування — одноаспектний. Та більшу практичну і теоретичну значимість має багатоаспектне індексування, що пов’язується з побудовою складних пошукових образів, які складаються з декількох лексичних одиниць ІПМ. Основним принципом, яким має керуватися предметизатор, є: «Головне інформацію не ввести, головне інформацію знайти». Тому обов’язково при відборі понять індексатор має уявляти запити, які можуть поступити від користувачів.

З розвитком комп’ютерних технологій поняття тематичного аналізу та предметних рубрик почали зазнавати змін. Повноцінне і якісне управління електронним каталогом є неможливим без авторитетних файлів, які використовуються в бібліографічних записах. Вони служать для того, щоб об’єднати під одним терміном усі можливі варіанти певного поняття, серед яких: ім’я особи, назва організації, родове ім’я, географічна назва, уніфікований заголовок, тематична предметна рубрика. Це допомагає уніфікувати формулювання авторських та тематичних заголовків та уникнути дублюванню. Тож авторитетні записи — це своєрідні довідники, що сприяють успішному пошуку, забезпечуючи однозначність вираження понять. Створення та підтримка авторитетних записів є дуже трудомістким процесом, але на практиці він себе виправдовує. У програмному середовищі МАРК-SQL існує спеціально розроблена програма «MarcAuth», що базується на комунікативних форматах «Формат MARC21 для авторитетних даних» та «Российский коммуникативный формат представления авторитетных/нормативных записей в машиночитаемой форме (російська версія UNIMARC)».

Подальший розвиток предметизації пов’язаний з необхідністю створення надійної системи ведення і підтримки інформаційно-лінгвістичного забезпечення, яка має розроблятись на загальнодержавному рівні, а не локально, лише зусиллями ентузіастів. Перспективою застосування предметизації може стати лише співпраця всіх установ, які займаються цими питаннями. Актуальність уніфікації предметизації ще більш зростає, якщо врахувати перспективи обміну бібліографічними базами даних, створення електронних зведених каталогів, взаємонадання доступу до інформаційних ресурсів. Успіх функціонування електронних форм інформації і використання їх у бібліотеках залежить від кожної установи, чіткого дотримання вимог стандартів та методики каталогізування.

Попередня Наступна

 

Для редагування, видалення інформаціі про дитину з сайту або повідомлення про нелегальний контент Ви можете звернутися за адресою: library@chl.kiev.ua

 
Останнє оновлення: 20.11.2024
© 1999-2010р. Національна бібліотека України для дітей