Dobri-porady.pp.ua
Поради для маленьких і великих

допомогу при обробці великих масивів даних - інформаційно пошукові системи.

У сучасному світі, наповненому інформацією, інколи буває надзвичайно складно знайти потрібні дані, класифікувати їх, провести аналіз, порівняння та обробку. На щастя, в цій нелегкій праці можуть допомогти сучасні досягнення цивілізації. Це інформаційно пошукові системи, кожна їх яких є прикладною комп'ютерною середовищем, призначеної для здійснення пошуку, зберігання, обробки, фільтрації, сортування великих масивів структурованих даних.

Більш просте визначення, яке часто використовують, описуючи інформаційно пошукові системи, звучить так. Інформаційно пошукові системи - це системи, що здатні забезпечити пошук і відбір необхідної інформації за допомогою використання спеціальної бази даних, яка містить описи джерел даних (індекс), що ґрунтуються на інформаційно-пошуковому мовою. Пошук інформації в таких системах повинен виконуватися за певними правилами, відповідним інформаційно-пошукової мови. Однією з найбільш поширених і використовуваних в Рунеті інформаційно-пошукових систем є нигма ру алгебра.

Інформаційно пошукові системи поділяють на два види:

1.Документографические. Даний вид системи характеризується тим фактором, що кожен зберігається в них документ повинен бути проіндексовані спеціальним чином. Іншими словами кожен з документів володіє спеціальним кодом, який і складає пошуковий образ. Пошук здійснюється по пошукових образів, а не з самих документів. Цей принцип нагадує пошук книги у великій бібліотеці. Спочатку необхідно відшукати картку в спеціальному каталозі, а потім, знаючи номер, зазначений на картці ставати можливим обчислення місцезнаходження самої книги.

2.Фактографічні. Такі інформаційно-пошукові системи зберігають факти, що стосуються певної області знань, а не документи, що їх підтверджують. Пошук організований саме за зразком певного факту.

Головна задача, яку успішно вирішують інформаційно пошукові системи - це пошук релевантних даних інформаційним запитам і потребам користувачів. Надзвичайно важливим аспектом роботи з системами є відсутність втрачених даних, тобто необхідно знайти кожен документ, який відноситься до запиту і не знайти при цьому зайвої інформації. Для здійснення цієї вимоги, введена якісна характеристика процесу пошуку - релевантність. Релевантністю називають відповідність результатів, отриманих в ході пошуку, запит, який був сформульований.

Основних цілей, переслідуючи які розробляються традиційні інформаційно пошукові системи кілька. Отже, необхідно:
- забезпечити переведення природної мови, який використаний у документах на контрольований словник, застосовний для пошуку та індексування;
- забезпечити послідовне використання одиниць індексування;
- описати відношення між термінами;
- використовувати систему як пошукове засіб при пошуку документів.

Трохи докладніше зупинимося на сервісі, який здобув величезну популярність - нигма математика. Ця система дає своїм користувачам можливість вирішувати математичні завдання. Серед можливостей системи - спрощення математичних виразів, розв'язування рівнянь, систем рівнянь і багато іншого. Все це здійснюється в автоматичному режимі після введення вирази у рядку пошуку. Система наділена здатністю розпізнавання більше тисячі математичних і фізичних одиниць виміру і констант, а це дозволяє користувачеві оперувати різними величинами. Виданий системою відповідь у цьому випадку буде точно відповідати вказаним одиниць вимірювання. Крім того за допомогою системи нигма математика можна вирішувати будь-які завдання, зазвичай покладаються на калькулятори та конвертери валют.