2
Білоруський державний університет
Історичний факультет
РЕФЕРАТ
На тему:
"Вивчення історичних джерел на основі застосування кількісних методів і нових інформаційних технологій"
МІНСЬК, 2008
Обмежені можливості аналізу джерела традиційними методами зовнішньої і внутрішньої критики проявилися в кінці XIX - початку XX ст. в зв'язку з кризою позитивістської парадигми, орієнтованої на ілюстративність в подачі історичних фактів. Для більш глибокого вивчення джерел потрібні були нові аналітичні методи, які були запозичені істориками з інших гуманітарних наук, в першу чергу з соціології.
Іншою причиною звернення до нових методів було зміщення інтересу істориків від опису індивідуальних явищ (ідеографічного підходу) до дослідження типових явищ в історії (генерализирующий підходу). Цей зсув було пов'язано з проникненням в історичні дослідження в другій половині XIX - початку XX ст. ідей філософських і політичних напрямків, які були орієнтовані на вивчення діяльності макросоціальних груп (наприклад, марксизм з інтересом до класів і класової боротьби). Вже на початку ХХ ст. історики активно почали використовувати методи дескриптивної (описової) статистики при обробці історичних джерел.
Новий етап активного використання кількісних (математичних) методів почався в кінці 1950-х - початку 1960-х рр. Кількісні методи, на думку І.Д. Ковальченко, являють собою "звичайний аналіз явищ і процесів на основі системи кількісних показників", а математичні - "це побудова на основі системи чисельних даних формально-кількісних, математичних моделей цих процесів і явищ". Основною причиною, що викликала інтерес істориків до використання кількісних методів, було широке запровадження в дослідження масових історичних джерел, які можна було ефективно обробляти тільки за допомогою даних методів.
Масовими, на думку І.Д. Ковальченко, можна назвати "джерела, що характеризують такі об'єкти дійсності, які утворюють певні суспільні системи з відповідними структурами". Найбільш поширеними видами масових джерел І.Д. Ковальченко вважав: статистичні матеріали (перепису та обстеження), матеріали діловодства та особистого обліку, систематизовані довідкові матеріали, т. Е. Джерела, які дозволяли вивчати масові процеси та явища, і в яких інформація містилася в агрегованої (узагальненої) формі. Б.Г. Литвак виділив інші ознаки масових джерел (велика кількість збережених джерел певного виду, єдиний формуляр і ін.), Які притаманні переважно матеріалами діловодства.
Другою причиною активізації інтересу до кількісних методів було прагнення дослідників підвищити інформативну віддачу джерел. На думку І.Д. Ковальченко, який розглянув джерело в світлі теорії інформації, отримувати дані з джерела можна нескінченно. Це викликано тим, що в джерелі поряд з відкритими (явними) відомостями присутня прихована (структурна) інформація (взаємозв'язку між показниками, угруповання історичних об'єктів і ін.), Яку можна витягти тільки за допомогою кількісних методів. Перевагою прихованої інформації є її велика об'єктивність, так як вона формується незалежно від позиції автора джерела.
Процес використання кількісних методів значно спростився в зв'язку застосуванням електронно-обчислювальних машин (комп'ютерів), що дозволили автоматизувати процес розрахунку кількісних показників. Починаючи з кінця 1950-х - початку 1960-х рр., В джерелознавчих дослідженнях кількісні методи застосовуються в поєднанні з інформаційними технологіями.
Нові інформаційні технології являють собою методи роботи з інформацією, засновані на застосуванні сучасних технічних засобів (комп'ютерів, сканерів, модемів та ін.) І програмного забезпечення. На підставі застосування кількісних методів і комп'ютерів в 1960-і - 1980-і рр. з'явилися такі перспективні напрямки як "нова політична історія", "нова економічна історія" (економетрія), "нова соціальна історія" в США, квантитативная історія (кліометріка) в країнах Європи, школа по використанню математико-статистичних методів і ЕОМ в історичних дослідженнях під керівництвом І.Д. Ковальченко в СРСР.
Процес комплексного застосування кількісних методів та інформаційних технологій при обробці історичних джерел пройшов у своєму розвитку два основних етапи. Перший етап охопив 1960-і - першу половину 1980-х рр., Отримавши за визначенням Л.І. Бородкіна назву "Ера великих ЕОМ". Він характеризувався використання великих ЕОМ з обмеженим обсягом пам'яті і програмним забезпеченням, яке вимагало при роботі історика з комп'ютером присутності посередника-програміста. Другий етап - час "мікрокомп'ютерної революції" кінця 1980-х - 1990-і рр., Яка надала історикам персональний комп'ютер з дружнім інтерфейсом і комерційним програмним забезпеченням, що дозволило практично виключити з "ланцюга дослідження" посередника-програміста.
На першому етапі кількісні методи і комп'ютери найбільш інтенсивно використовувалися при аналізі письмових джерел. Кількісний аналіз дозволяв:
Розшифрувати джерела, написані на невідомих "мертвих" мовах. Подібні дослідження на початку 1960-х рр. провели новосибірські вчені В.А. Устинов, Е.В. Еврєїнов і Ю.Г. Косарев, що проаналізували Дрезденську і Мадридську рукописи, а також книги "Чилам Балам", написані на мові майя. За допомогою методу підрахунку частоти складів і слів, близького до контент-аналізу, і комп'ютера їм вдалося підтвердити думку найбільшого знавця писемності майя Ю.В. Кнорозова про иероглифическом характері письма стародавніх майя, встановити відповідність між мовою рукописів і мовою майя початкового періоду колонізації XVI-XVII ст., Ототожнити більше 90% ієрогліфічних комплексів Дрезденської і Мадридській рукописи зі словами мови майя періоду колонізації.
Провести атрибуцію, т. Е. Визначити автора історичного джерела. В середині 1970-х рр. Л.В. Мілов, Л.І. Бородкін за допомогою формального аналізу особливостей стилю встановлювали авторство анонімних творів ХV-XVI ст.
Виявити приховану (структурну) інформацію, закладену в історичному джерелі. Наприклад, за допомогою методу контент-аналізу Л.М. Брагіна в 1972 р визначила частоту зустрічальності етичних понять в трактаті "Про дійсне шляхетність" італійського гуманіста XV ст. К. Ландіна. А потім використовувала в комплексі з контент-аналізом метод кореляційного аналізу для визначення тісноти зв'язку між цими етичними термінами.
Обробити великі масиви інформації, що містяться в масових історичних джерелах (Писцовой книгах, описах поміщицьких маєтків, матеріалах статистики та ін.).
Побудувати генеалогічні Стемм (древа) рукописних джерел. В середині 1970-х рр. Л.В. Мілов і Л.І. Бородкін побудували генеалогічну Стемм рукописного законодавчого джерела - "Закону Судного людем", що дозволило класифікувати всі списки пам'ятника.
Проводити історико-типологічні дослідження джерел методами автоматичної класифікації (кластер-аналізу та ін.)
Конкретні форми аналізу джерел дозволили розробити на теоретичному рівні методику їх обробки на основі кількісних методів та інформаційних технологій. Для того, щоб проаналізувати джерело на комп'ютері, його піддавали процедурі формалізації і кодування. При формалізації весь текст джерела структурували, виділяючи однорідні історичні об'єкти (поміщицькі маєтки, селянські господарства та ін.) Або однакові категорії (етичні поняття, соціальні групи і ін.). Потім на етапі кодування виділених об'єктах або категоріям привласнювали цифрові коди. Необхідність кодування диктувалася тим, що "великі ЕОМ" обробляли інформацію тільки в кількісній формі.
На етапі "великих ЕОМ" виникали обмеження в застосуванні кількісних методів при аналізі оповідних джерел, інформація яких була слабо структурована. При формалізації подібних джерел частина інформації не вдавалося перевести в кількісну форму, і вона губилася. Цей недолік був усунений тільки в період "мікрокомп'ютерної революції", коли були розроблені повнотекстові бази даних і заснований на їх застосуванні джерельно-орієнтований підхід. Ці нові комп'ютерні технології дозволили обробляти всю інформацію оповідного джерела, проводити інформаційний пошук, і навіть встановлювати лакуни (пропуски) і інтерполяції (пізніші вставки) в тексті джерела.
Поява нових програмних засобів (мультимедійних систем, геоінформаційних систем та ін.) І технічних засобів (сканерів та ін.) В період "мікрокомп'ютерної революції" дозволило як знайти нові методи аналізу письмових джерел, так і обробляти інші типи історичних джерел (речові, образотворчі, картографічні, кінофотодокументи, фонодокументи і ін.). В даний час нові інформаційні технології застосовуються при вирішенні таких джерелознавчих проблем:
Подання письмових і образотворчих джерел у вигляді графічних файлів дозволяє досліднику безпосередньо працювати з текстом або зображенням джерела і поліпшити пошкоджені сторінки, ікони, картини.
Поява лазерних дисків (CD-ROMов) і використання інформаційних ресурсів глобальної комп'ютерної мережі Internet надало дослідникам прямий доступ до історичних джерел в електронній формі, що знаходяться в архівах, бібліотеках і музеях інших країн.
Застосування в обробці даних джерела нових теоретичних концепцій, що прийшли з інших галузей науки (наприклад, методів синергетики, теорії хаосу або нелінійної динаміки, розроблених бельгійським вченим І. Пригожиним, методів штучного інтелекту та ін.).
У 1990-і рр. виникли нові галузі джерелознавства - комп'ютерне та інформаційне джерелознавство. Комп'ютерне джерелознавство - це дисципліна, орієнтована на розробку методів аналізу історичних джерел за допомогою комп'ютера, принципів їх формалізації та подання в електронній формі, а також загальних підходів використання інформаційних та комп'ютерних технологій в історичному дослідженні. Інформаційне джерелознавство засноване на вивченні джерела в світлі теорії інформації.
Використання комп'ютерів і комп'ютерних мереж призвело до появи нового типу джерел - електронних документів. Багато з них стають "мультимедійними", об'єднуючи текст, комп'ютерну графіку, відео, анімацію, звук. Для обробки подібних "мультимедійних" джерел необхідно використовувати нові методи аналізу, і навіть спеціальна мова (HTML-мову і гіперпосилання на цитовані WWW сервера).
Різні види програмного забезпечення надали можливість історикам вивчати джерела за наступними напрямками:
статистичні пакети (STATISTICA для Windows, Statgraphics, SPSS та ін.) дозволили аналізувати як статистичні джерела, так і джерела з Некількісні інформацією за допомогою широкого набору математико-статистичних методів.
електронні таблиці (Lotus 1-2-3, Quattro Pro, Excel і ін.) Дали можливість ефективно працювати зі статистичними джерелами, які представлені у формі таблиць.
системи управління базами даних (DBASE, FoxPro, Paradox та ін.) дозволили обробляти статистичні джерела, структуровані масові джерела, що мають єдиний формуляр (метричні книги, особисті справи, анкети та ін.), текстові (наративні) джерела, зображення.
текстові редактори і процесори надали можливість проводити різні операції з текстами історичних джерел.
графічні редактори, а також нові комп'ютерні технології (мультимедійні системи), засновані на використанні сканерів, відеотехніки, оптичних лазерних дисків (CD-ROM), дозволили зберігати і аналізувати образотворчі джерела.
програми комп'ютерного картографування та географічні інформаційні системи (Atlas * GIS, ARC / INFO, MapInfo і ін.) дали можливість відтворювати і обробляти картографічні джерела.
"Мікрокомп'ютерних революція" також сприяла залученню до аналізу джерел систем штучного інтелекту (баз знань, експертних систем, когнітивних комп'ютерних моделей розуміння тексту, фреймових систем і ін.), В яких були змодельовані знання істориків-професіоналів.
У 1990-ті роки в кількісному і комп'ютерному аналізі джерел намітилися такі основні тенденції. Були продовжені, розпочаті з 1977 р Л.В. Мілов і Л.І. Бородкін, джерелознавчі дослідження, присвячені атрибуції оповідних джерел XII-XVIII ст. На основі аналізу статистики парної зустрічальності граматичних класів слів були зроблені спроби встановити авторство "Повісті временних літ", "Слова о полку Ігоревім", "Листів до Фалалею" (XVIII ст), визначити "стильові портрети" автора "Слова про закон і благодать" митрополита Іларіона, Кирила Туровського, Івана Пересветова, князя А. Курбського, царя Івана Грозного.
За допомогою пакета прикладних програм, розробленого Є.В. Злобіним, була проведена атрибуція "Записок" члена суспільства "Сполучених слов'ян", декабриста І.І. Горбачевського. В результаті статистичного аналізу, заснованого на підрахунку частоти народження службових слів у реченні, був зроблений висновок, що автором "Записок" був інший, анонімний автор.
Такими ж методами Є.В. Злобіним і А.В. Бистровим було проаналізовано передсмертний лист Б.В. Савінкова з метою встановлення його авторства. За версією А.І. Солженіцина автором листа був агент ОГПУ Я. Блюмкін, колишній лівий есер, що прославився участю в замаху на німецького посла Мірбаха в 1918 р Порівняльному аналізу піддалися художні твори "Те, чого не було", "Кінь вороною", статті та листи Б.В . Савінкова, дві записки Я. Блюмкина і передсмертний лист. Використання кількісних методів в поєднанні з змістовним аналізом джерела, дозволили зробити висновок, що Я. Блюмкін не міг написати за Б.В. Савінкова його передсмертний лист.
Українська дослідниця І.О. Тарнопольська методом діграммной ентропії, який дозволяє визначити статистичні зв'язки між буквами і частоту зустрічальності кожного символу в тексті в процентному співвідношенні, а також парну зустрічальність цих символів, досліджувала історична праця XVII в. "Синопсис", створений в Києво-Печерській Лаврі і приписуваний І. Гизелю. Розбіжності в коефіцієнтах діграммной ентропії дозволили зробити висновок, що в створенні "Синопсиса" брали участь чотири учасника.
Другим напрямком обробки текстових джерел стало використання методу контент-аналізу для виявлення прихованого змісту тексту джерела або характеристики світогляду, психологічних рис і менталітету автора джерела. Наприклад, А.В. Бистров використовував комп'ютерний контент-аналіз мемуарів про Б.В. Савінкова для складання його психологічного портрета і характеристики його поведінки в момент загибелі. Підрахунок частоти народження в мемуарах сучасників психологічних оцінок Б.В. Савінкова (найбільш часті оцінки "живий", "артистичний", "чарівний") дозволив зробити висновок про те, що Савінков належав до истероидному (артистичному) психологічним типом. Тому він сам був організатором своєї загибелі, будучи "режисером" і "виконавцем" самогубства 7 травня 1925 року. Тим самим припущення А.І. Солженіцина про те, що Савінков був викинутий охоронцями в сходовий проліт внутрішньої Луб'янській в'язниці не знайшло свого підтвердження. Роботи А.В. Бистрова дають приклад плідного поєднання кількісних і психологічних методів обробки історичних джерел.
Метод контент-аналізу був значно ускладнений В.І. Тихоновим при обробці особистих справ громадян, позбавлених виборчих та інших соціальних прав в 20-і рр., Т. Н. "Позбавленців". За допомогою спеціально розробленої методики статистичної категоризації були виділені 80 категорій за такими напрямками, як твердження трудового і заперечення "нетрудового" статусу, нарікання на нелегке життя і виправдання "нетрудовий" діяльності. Потім за допомогою статистичного пакета SPSS була проведена автоматичне групування і методом кластер-аналізу були виділені 5 типів заяв позбавленців, в яких групувалися загальні уявлення позбавленців про те, хто в СРСР гідний виборчих прав (люди займаються "суспільно-корисною працею", які не використовують найману працю, отримували "нетрудові доходи" в незначній кількості і ін.). Потім методом дискримінантного аналізу заяв позбавленців були виявлені загальні та особливі риси прийняття рішень чиновниками виборчих комісій Москви про відмову або відновленні цивільних прав. Був зроблений висновок про те, що відновлення в правах проходило в силу господарських причин, проте колишнім великим торговцям, священикам та представникам експлуататорських класів у відновленні завжди відмовлялося.
Третім напрямком застосування кількісних методів стала обробка масових джерел методами багатовимірного статистичного аналізу. Наприклад, російський вчений С.Г. Кащенко за допомогою методів аналізу варіаційних рядів, вибіркового методу і кореляційного аналізу досліджував масові джерела по реформі 1861 р Санкт-Петербурзької, Псковської і Новгородської губерній - статутні грамоти, викупні акти та ін. С.В. Воронкова застосувала кореляційний і кластерний аналіз до масових джерел з історії промисловості Росії початку ХХ століття - промисловим переписами 1900 1908 і 1910-1912 рр. Кількісний аналіз дозволив дослідникам уточнити висновки традиційної історіографії з проведення реформи в північно-західних губерніях Росії в 1861 р і розвитку російської промисловості в 1900-1912 рр.
Білоруський історик А.Г. Кохановський на підставі обробки методами багатовимірного статистичного аналізу опублікованих підсумків перепису 1897 р даних поземельних переписів 1877 і 1905 рр., Військово-кінських переписів тисячу вісімсот вісімдесят вісім і 1900 рр. та інших статистичних джерел провів вивчення соціально-класової структури народонаселення Білорусі в другій половині XIX ст. Дослідник виділив 20 кількісних ознак, які фіксують питома вага основних соціальних груп населення Білорусі, і здійснив аналіз взаємозв'язків між ними методами кореляції та регресії. Інтерпретація матриці коефіцієнтів кореляції дозволила зробити висновок про слабкість соціальної мобільності сільськогосподарського населення Білорусі в кінці XIX в. і незначному рівні впливу процесу капіталізації на соціальну структуру села. Аналіз регресійних моделей дозволив виділити результуючі (залежні) ознаки: питома вага зайнятого в промисловості населення, сільських жителів, зайнятих несільськогосподарськими промислами, грамотного населення та ін. За допомогою методу головних компонент (різновиди факторного аналізу) було проведено порівняльне вивчення 35 білоруських повітів і виділено три основні чинники, що впливають на соціальну структуру населення. На завершальному етапі роботи був використаний агломеративного-ієрархічний метод кластерного аналізу, який дозволив виділити 4 регіональних типу повітів, близьких між собою по соціально-класовій структурі. Застосування методів багатовимірного статистичного аналізу дало можливість проранжувати повіти за рівнем їх соціального розвитку.
Обробка масових джерел методами багатовимірного статистичного аналізу в даний час все частіше проводиться з використанням таких інформаційних технологій, як електронні таблиці і статистичні пакети.
Четвертим напрямком в застосуванні кількісних методів та інформаційних технологій стала обробка джерел за допомогою реляційних і повнотекстових баз даних. Білоруськими дослідниками В.Є. Кудряшовим і О.Л. Липницький були введені бази даних і оброблені масові історичні джерела - попис війська Великого князівства Литовського 1528, 1565 і 1567 рр., Матеріали Литовської Метрікі.В.Е. Кудряшов за допомогою СУБД Access 7.0 обробив реєстр подимного оподаткування Оршанського повіту Великого князівства Литовського 1667 р Досліднику вдалося виділити в високо структурованому джерелі три основні категорії платників податків: шляхта, духовенство і "люди простого стану" - міщани і татари. Статистичний аналіз показав, що між титулом платника податків, яку він обіймав державною посадою і розміром його землеволодіння існує пряма кореляція. На підставі розрахунку середніх статистичних величин - моди і медіани дослідником було встановлено, що типовий платник податків Оршанського повіту носив титул "пан" і мав всього 1 дим. Розрахований був також коефіцієнт Джині, величина якого дозволила зробити висновок про високий ступінь концентрації нерухомості в руках невеликої групи великих землевласників.
Є.Я. Павлова на підставі списків особового складу загонів і бригад за період 1942-1944 рр. склала базу даних по партизанам Мінської і Бресткой областей, яку опрацювала за допомогою електронних таблиць Excel і СУБД Access. На підставі аналізу було встановлено питому вагу різних національностей партизанів, їх освітній рівень, партійність, питома вага партизан-жінок і молоді. М.А. Войтович склав базу даних по 6 інвентарів володіння Тимкович Новогрудського воєводства і проаналізував еволюцію грошових і натуральних повинностей селян за період з 1622 по 1761 рр.
На підставі накопиченого досвіду щодо застосування кількісних методів та інформаційних технологій для аналізу історичних джерел, можна зробити висновок, що нові методи, що дають додаткові можливості у вивченні пам'яток минулого, найефективніше використовувати в поєднанні з традиційними методами джерелознавчого дослідження.
ЛІТЕРАТУРА
Бєлова Є.Б., Бородкін Л.І., Гарскова І.М., Ізместьева Т.Ф., Лазарєв В.В. Історична інформатика. М., 2006.
Методи кількісного аналізу текстів наративних джерел. М., 2003.
Від Нестора до Фонвізіна. Нові методи визначення авторства / Под ред. Л.В. Мілова, М., 2004.
Сидорця В.Н., Баликіна Е.Н. і ін. Історична інформатика. Мн., 2008.
|