Гиляревский Р.С., Мульченко З.М., Терехин А.Т., Черный А.И. Опыт изучения "Science Citation Index" (1968)

Навигация
Материалы по Индексу цитирования
Гиляревский Р.С., Мульченко З.М., Терехин А.Т., Черный А.И.
Кафедра научной информации МГУ им.М.В.Ломоносова, Институт истории естествознания и техники АН СССР, Лаборатория статистических методов МГУ им.М.В.Ломоносова, Всесоюзный институт научной и технической информации АН СССР


LogoОПЫТ ИЗУЧЕНИЯ  SCIENCE CITATION INDEX 


За последнее время внимание многих ученых привлекли библиографические указатели нового типа, получившие название "Указатели цитированной литературы" или "Индексов научных цитат". Наиболее полным и доступным изданием такого типа является "Science Citation Index" (SCI) - "Указатель цитированной литературы по точным, естественным и прикладным наукам", выпускаемый под редакцией Ю.Гарфилда Институтом научной информации (Филадельфия, США).
Ниже подробно описывается названный указатель и изложены результаты его использования.

ОПИСАНИЕ SCI

Широко известно, что в любой научной работе используются идеи и факты предыдущих работ в этой области. Научное использование предполагает либо новое истолкование уже имеющихся данных, либо подтверждение ими новых идей, либо дальнейшее развитие высказанных ранее мыслей, либо опровержение правильности этих мыслей и достоверности приводимых фактов. В каждом из перечисленных случаев ученые почти всегда ссылаются на работы своих предшественников, исследовавших до них те же, аналогичные или смежные вопросы. Эта практика возникла столетие назад и уже более полувека является обязательной нормой, служит критерием добросовестности научной публикации. Изучение библиографических ссылок в большом числе публикаций показало, что они [переход со стр.32-->на стр.33 печатной статьи] образуют густую сеть связей между научными документами. Группировка документов по ссылкам на одни и те же публикации позволяет выявить внутренние связи между самыми отдаленными предметами или вопросами задолго до того, как эти связи будут осознаны или изучены. Это достигается автоматически, поскольку авторы научных публикаций, посвященных самым разнообразным вопросам, могут ссылаться на один и тот же документ, который они считают исходным для своей работы.
Библиографические ссылки в статьях и книгах на использованные их авторами материалы давно служат ученым и специалистам-практикам важным средством для отыскания необходимых им источников информации. Однако путь этот долог, трудоемок и не дает исчерпывающих сведений. Библиографические ссылки становятся гораздо более эффективным средством информационного поиска, если следить за ними в обратном порядке. Обычно мы интересуемся, на какие работы ссылается автор данной публикации, но гораздо важнее знать, в каких публикациях содержатся ссылки на данную работу. Если выявить все последующие публикации, в которых имеются ссылки на данного автора, то можно узнать широту распространения идей данного автора, области их практического применения, а также объективно оценить значимость его работы.
Американский ученый Г.Аллен составил схему использования и взаимовлияния полутора десятков работ по вопросу выявления нуклеиновых кислот, опубликованных в 1941-1960 гг. Он обнаружил, что для получения сведений обо всех этих работах по содержащимся в них пятнадцати библиографическим ссылкам необходимо обратиться к пристатейной библиографии по меньшей мере шести статей, опубликованных с 1956 по 1960 г. Некоторые статьи, которые почти не упоминаются в последующих публикациях, вообще трудно выявить таким путем. Но сведения почти обо всех этих работах легко получить, если узнать, где содержатся библиографические ссылки на три ранние работы.
До последнего времени указанный принцип использовался лишь в традиционных библиографиях рецензий (известных с 1771 г.)* [Подстроч. прим.: Первой библиографией рецензий была "Парижская библиография", учитывавшая по двум журналам рецензии на книги, [переход: стр.33-->стр.34] изданные в 1770 г. в Париже (Bibliographie parisienne. Paris, Desnos, 1771-1772)], где материал всегда располагаетcя по рецензируемым книгам, а не по рецензиям. Это понятно, так как рецензия представляет интерес не сама по себе, а лишь в связи с работой, на которую она написана. Известны и указатели судебных прецедентов со ссылками на законы США и Великобритании, в судопроизводстве которых прецеденты играют большую роль. Поэтому юристы каждый раз при применении того или иного закона должны учитывать, в каких процессах и как был применен данный закон. Примером служит "Указатель ссылок федерального законодательства о труде" Шепарда [1], издаваемый в США с 1873 г.
Основная роль в пропаганде этой идеи, которая получила позже название метода "библиографического сочетания" (bibliographic coupling), а также в ее практическом применении, принадлежит американскому химику Юджину Гарфилду [2]. В 1963 г. возглавляемая им фирма Institute for Scientific Information выпустила экспериментальный вариант SCI, а с 1964 г. начала издавать его регулярно. Указатель 1965 г. содержал сведения о 3,3 млн. ссылок в 196 тыс. публикациях по всем точным, естественным и прикладным наукам и в 60 тыс. патентных описаниях США. В третьем квартале 1966 г. число названий просматриваемых журналов достигло 1500. Указатель содержит список всех работ, которые упоминались в какой-нибудь из публикаций текущего года, и состоит из двух частей, издаваемых в виде отдельных томов - собственно "Указателя цитированной литературы" и "Указателя источников". Обе части выходят ежеквартально и кумулируются за год. В первой основной части материал располагается в алфавитном порядке фамилий первых авторов цитированных документов* [Подстроч. прим.: Термин "цитированный документ" принят нами для обозначения документа (статьи, книги, отчета и т.п.), на который в тексте другого документа (статьи, книги, отчета и т.д.) имеется библиографическая ссылка]. Под каждой заглавной фамилией приводятся в алфавитном порядке фамилии первых авторов документов, содержащих ссылки на цитированный документ. Будем их называть "документами-источниками", или просто источниками. Сведения о работах одних и тех же авторов располагаются в хронологическом порядке. Рядом с фамилией указываются сокращенное [переход: стр.34-->стр.35] название журнала, год издания, номер тома и номер первой страницы публикации. Перед годом издания приводится индекс, обозначающий тип документа-источника (статья, доклад, отчет, реферат, рецензия, обзор и т. п.).
Сложные и составные фамилии записываются как одно слово. Дефис, апостроф и другие знаки в составе фамилий опускаются. При любом числе авторов указывается имя лишь первого автора. Для документов, изданных без указания индивидуального автора, вместо его имени приводится слово "Anonimous". Год издания как цитированных документов, так и документов-источников дается в виде двух последних цифр. Год публикации самой ранней из цитированных работ данного автора выделяется звездочками (табл. 1).
Во второй части указателя - "Указателе источников" - материал также располагается по алфавиту имен первых авторов. В отличие от первой части, где всегда указывается только фамилия первого автора, здесь приводятся фамилии всех соавторов, если их не более десяти. Характерной чертой этой части указателя является наличие в каждом описании полного заглавия публикации. В описание включаются также сокращенное название журнала, в котором опубликована статья, номер тома и страницы, год издания журнала, обозначение типа источника, число ссылок в документе, номер выпуска или части журнала табл.2.
"Указатель цитированной литературы" подготавливается с помощью электронных цифровых вычислительных [переход: стр.35-->стр.36] машин (ЭЦВМ).
    Таблица 1.
    Табл.1
    ОБОЗНАЧЕНИЯ
    1 - автор цитированного документа; 2 - автор документа-источника; 3 - год публикации цитированного документа; 4 - журнал; 5 - год публикации источника; 6 - номер тома; 7 - номер первой страницы. *59* указывает на самую раннюю из цитированных работ данного автора; А - реферат; В - рецензия; С - исправление; D - дискуссия; Е - редакционная статья; I - биография, некролог; Р - патентное описание; Q - библиография; R - обзор; без обозначения - статья; ˜ - не журнальная публикация и т.д.
Это позволяет выпускать его в очень сжатые сроки. Объем содержащейся в указателе информации настолько велик, что обработка ее вручную просто невозможна. Вместе с тем, применение ЭЦВМ налагает [переход: стр.36-->стр.37] на объем каждого описания ряд ограничений. Для каждого типа сведений отводится строго фиксированное число знаков. Например, для фамилии и инициалов автора цитированного документа - не более 18, а для тех же сведений об авторе документа-источника - всего 11.
"Указатель цитированной литературы" не предназначен для замены традиционных библиографических указателей. Он является новым средством информационного поиска.
Таблица 2.
Табл.2
ОБОЗНАЧЕНИЯ

1 - автор; 2 - журнал; 3 - том; 4 - номер первой страницы; 5 - год; 6 - число ссылок; 7 - выпуск, часть; 8 - инвентарный номер; 9 - журнал; 10 - том; 11 - страница (9, 10, 11 - перекрестная ссылка); 12 - заглавие; 13 - первый автор; 14 - второй автор; Р - патентное описание; R - обзор; О - статья.

В известных библиографических указателях при поиске документов по их содержанию исходным является специальный поисковый образ - классификационный индекс, предметный заголовок, набор дескрипторов и т.п. В указателе используются формальные и однозначные сведения - фамилии автора заранее установленного [переход: стр.37-->стр.38] документа, посвященного определенному вопросу. Новый указатель, будучи построен по авторскому признаку, дает ответы на запросы содержательного характера. Это можно проиллюстрировать следующим примером. Допустим, что нас интересуют работы в области кибернетики и ее приложений. Достаточно знать имя известного математика Н.Винера, чтобы под этим именем найти в указателе сведения почти обо всех нужных нам работах, так как почти в каждой из них обязательно содержатся ссылки на его работы.
Эксперименты по составлению подобных указателей в разных отраслях проводятся рядом научных учреждений США: по вопросам статистики - Принстонским университетом, по вопросам атомной энергии - фирмой "Итек", по вопросам психологии - Иллинойским университетом, по физике и смежным областям - Американским физическим институтом [3].

ИСПОЛЬЗОВАНИЕ SCI

До сих пор указатель использовался для решения трех типов задач:
    1) для поиска научной информации по определенным (как правило, узкоспециальным и новым) вопросам;
    2) для изучения развития определенных идей и объективной оценки их значимости;
    3) для изучения общих закономерностей распределения и старения научных публикаций.
П о и с к   необходимых документов по указателю производится следующим образом. На основе личного опыта или из обычных источников - энциклопедий, библиографий и т. д. устанавливается исходный для поиска документ. Под фамилией его автора в первой части указателя отыскиваются сведения о других, связанных с ним документах. Если на исходный документ никто не ссылался и он не отражен в указателе, можно взять в качестве исходного любую имеющуюся в нем библиографическую ссылку. По второй части указателя, в которой содержатся полные описания документов-источников, определяется их полезность для ученого. Если этих документов недостаточно, то любой из наиболее ранних документов-источников становится исходным для дальнейшего поиска. Эта операция повторяется до тех пор, пока не выявляются все [переход: стр.38-->стр.39] необходимые ученому документы, или до тех пор, пока поиск не перестанет давать новые сведения.
При этом одновременно устанавливаются другие работы автора исходного (цитированного) документа, а также другие работы авторов документов-источников (помимо непосредственно разыскиваемых). Общая схема такого поиска проведена в табл.3.

Таблица 3.
Табл.3
Преимущества указателя как поисковой системы проявляются особенно ясно при отыскании литературы по новым узко специальным вопросам и направлениям.
При все углубляющемся взаимопроникновении наук внутренние связи между отдельными предметами осознаются на сравнительно поздней стадии исследований. В схемах классификации и в списках предметных заголовков эти связи проявляются еще позже в виде новых заголовков или перекрестных ссылок между прежними заголовками. В дескрипторных языках эти связи устанавливаются лишь в результате анализа эффективности работы той или иной системы в течение сравнительно большого периода времени. Между тем в "Указателях цитированной [переход: стр.39-->стр.40] литературы" внутренние связи между самыми отдаленными предметами выявляются задолго до того, как эти связи будут осознаны исследователями. При этом совершенно устраняется субъективность мнений, неизбежная при традиционных процессах классификации и предметизации. Поэтому "Указатель цитированной литературы" является ценным источником информации по новым и особенно межотраслевым проблемам науки и техники.
Возможность   и з у ч е н и я   р а з в и т и я   о п р е д е л е н н ы х   и д е й   с помощью "Указателя цитированной литературы" была подтверждена экспериментом, проведенным в 1964 г. Ю.Гарфилдом [4]. История одного из важнейших открытий современной биологии - механизма передачи наследственности посредством дезоксирибонуклеиновых кислот была параллельно исследована традиционным методом и методом библиографического сочетания. Традиционный метод основывался на изучении монографии известного американского ученого и писателя Айзека Азимова "Генетический код" [5], а метод библиографического сочетания - на "Указателе цитированной литературы по генетике".
Сравнение показало, что 65% работ, установленных обоими методами в качестве важных исторических моментов на пути к этому открытию, совпадают. Лишь для выявления публикаций прошлого века, когда практика ссылок на использованные работы не была еще достаточно развита, традиционный метод оказался несколько более действенным. Что же касается последних десятилетий, то "Указатель цитированной литературы" выявил множество связей между публикациями, упущенных в книге А.Азимова. Этот эксперимент убеждает в том, что указатели цитированной литературы верно и достаточно полно отражают подлинные связи в науке. Кроме того, он подтвердил априорное предположение, что чем больше внимание исследователей привлекает та или иная публикация и, следовательно, чем чаще они на нее ссылаются, тем более серьезное научное значение она имеет.
Таким образом, подобные указатели могут служить важным инструментом при изучении развития определенных направлений науки, идей определенных ученых, а также для объективной оценки плодотворности этих идей. Такая работа развертывается сейчас во многих отечественных и зарубежных учреждениях. В Лаборатории статистических [переход: стр.40-->стр.41] методов Московского государственного университета им. М.В.Ломоносова группа сотрудников под руководством В.В.Налимова ведет систематическую обработку текущих выпусков SCI с целью выявления прикладных работ, в которых используются математические методы исследования.
И з у ч е н и е   о б щ и х   з а к о н о м е р н о с т е й   распределения и старения научных публикаций с помощью "Указателя цитированной литературы" позволило сделать ряд важных выводов. Особенно интересны исследования Д.Прайса, Ю.Гарфилда [6], М.Кесслера [7], Дж.Тьюки [8], Р.Бартона и Р.Кеблера. Распределение ссылок между статьями, в которых они содержатся, подчиняется общим законам распределения массовых явлений - 10% научных публикаций вообще не содержит никаких библиографических ссылок, 85% содержит половину всех ссылок (в каждой работе от 1 до 25 ссылок), оставшиеся 5% публикаций с большим числом ссылок в каждой (обзорные работы) содержат остальные 50% всех ссылок. В среднем в каждой работе содержится около 15 ссылок, из которых 12-13 представляют собой ссылки на статьи в научных журналах.
Если предположить, что до текущего года по какой-либо отрасли или предмету было опубликовано 100 работ, то в течение этого года появится. еще 7 работ (7% прироста в год). Они будут содержать 91 ссылку на прежние работы (13 ссылок х 7). Распределение цитированных статей характеризуется следующими цифрами - 40 прежних статей в течение года не упоминаются совсем, 50 статей упоминаются по одному разу. И лишь 10 статей упоминаются более чем по одному разу. Таким образом, новые публикации как бы связывают своими ссылками только незначительную часть опубликованной ранее литературы, которая может быть отнесена к активному исследовательскому фронту науки.
Важно отметить, что "Указатель цитированной литературы" позволяет выявить эти наиболее ценные работы. В США обсуждается сейчас издание (на базе такого анализа) "Журнала действительно важных статей", в котором помещались бы перепечатки статей, наиболее часто упоминаемых в других работах.
"Указатель цитированной литературы" позволяет установить и примерный возраст таких статей. В среднем [переход: стр.41-->стр.42] он не превышает пяти лет. Во всяком случае, работы 1960-1965 гг. издания составляют больше половины (52,6%) всех работ, на которые в 1965 г. были сделаны ссылки [10]. Для характеристики процесса старения литературы в определенной отрасли науки недавно было применено понятие, заимствованное из ядерной физики. По аналогии с периодом полураспада радиоактивных веществ стали исчислять полупериод жизни научной литературы. Таким полупериодом считают время, в течение которого была опубликована половина всей используемой в настоящий момент литературы в определенной области. Оно точно совпадает со временем, в течение которого половина всей опубликованной в настоящий момент литературы в определенной области перестанет использоваться. Полупериоды жизни статей по разным отраслям науки составляют: физика 4,6 лет; физиология 7,2 лет; химия 8,1 лет; ботаника 10,0 лет; математика 10,5 лет; геология 11,8 лет [11].
Указатели цитированной литературы представляют и другие возможности для изучения общих и конкретных проблем научных публикаций. В частности, с их помощью можно выявить не только наиболее часто упоминаемые работы, но и научные журналы, на которые падает большинство ссылок. Подобная работа в 1956 г. была вручную проделана американским библиографом Ч.Брауном, который проанализировал распределение ссылок в 56 журналах на английском и немецком языках. Она дала исключительно интересный и ценный материал [12].

ОПЫТ РАБОТЫ С SCI

Мы исследовали возможность использования SCI для решения двух задач: составления библиографии по определенной узкой проблеме и оценки вклада, вносимого отдельными учеными или научными коллективами в мировую науку.
С о с т а в л е н и е   б и б л и о г р а ф и и.   Интересный эксперимент по составлению библиографии с помощью SCI был проведен Дж.Мартином [13]. Библиография составлялась по теме "Полупроводниковые свойства галлия". Дж.Мартином было показано, что с помощью SCI удалось выявить около 50% публикаций (сравнение проводилось с хорошим библиографическим списком, составленным [переход: стр.42-->стр.43] традиционными методами). Он обращает внимание на то, что с помощью обычных реферативных журналов, претендующих на исчерпывающую полноту охвата материала, удается выявить в среднем также лишь 65% публикаций. Результаты эксперимента, выполненного Дж.Мартином, указывают на высокую эффективность SCI. При этом надо учитывать также и то обстоятельство, что реферативные журналы, Рис.1 как правило, имеют сравнительно узкую направленность, а SCI охватывает очень широкую область знаний - все точные, естественные и прикладные науки. Эксперимент показал, что SCI, для составления которого просматривается всего лишь 2 или 3% общего числа журналов во всем мире, позволяет найти около половины нужных публикаций, другая половина содержится в остальных 97 - 98% журналов. По-видимому, журналы, выбранные для составления SCI, действительно являются важнейшими. Это иллюстрируется на рис.1.
Нам представляется, что эксперимент Дж.Мартина все же недостаточно хорошо выявил все достоинства SCI. Заметим, что такая тема, как полупроводниковые свойства галлия, хорошо вписывается в рубрикацию реферативных журналов. В этом случае, конечно, легко вести поиск по таким журналам. Гораздо сложнее обстоит дело с поиском публикаций по новым разделам знаний, которые возникают на пересечении нескольких научных дисциплин. В этом случае очень трудно проводить поиск по реферативным журналам. [переход: стр.43-->стр.44]
Мы провели эксперимент по составлению библиографии за 1965 г. по теме "Применение математических методов исследования в химии, технической физике, металлургии и биологии". Такую библиографию практически невозможно составить, пользуясь обычными реферативными журналами. Здесь надо учитывать следующие обстоятельства. В математических реферативных журналах, как правило, можно найти лишь работы общеметодического характера. Если же исследователя интересуют публикации, в которых описывается опыт применения новых методов исследования, то поиск литературы надо вести по всему множеству химических, физических, металлургических и биологических реферативных журналов. Результаты такого очень трудоемкого поиска обычно приводят лишь к разочарованию. Дело в том, что референты - специалисты по химии, физике, металлургии обычно интересуются только результатами той или иной работы. При реферировании они обычно опускают все, что относится к новым математическим методам исследования. Если иногда что-либо и сообщается об этих методах, то это делается в такой форме, что из реферата трудно получить ясное представление о применявшихся методах исследования.
Первый наш эксперимент относился к составлению библиографии по работам, описывающим опыт применения в химии и металлургии методов планирования эксперимента, которые связаны с именем известного американского статистика Дж.Бокса. Для сопоставления, в качестве эталона, была взята библиография, составленная Ю.П.Адлером и Ю.В.Грановским. Эта библиография составлялась как с помощью обычных методов (просмотр специалистом наиболее важных журналов), так и новым методом - путем просмотра библиографических ссылок в 30 основных химических и металлургических журналах. Этот поиск отличался от поиска по SCI только количественно - пришлось ограничиться просмотром небольшого числа журналов. Сопоставление двух библиографий дало интересные результаты. С помощью SCI было найдено 73 публикации. В их числе оказалось 29 таких, которые отсутствуют в библиографии, составленной Ю.П.Адлером и Ю.В.Грановским. В библиографии, составленной с помощью SCI, не оказалось лишь семи работ, найденных Ю.П.Адлером и Ю.В.Грановским. Следует заметить, [переход: стр.44-->стр.45] что из этих семи работ три были опубликованы в трех советских изданиях, которые не используются при подготовке SCI.
Нами была сделана также попытка выявить публикации по биологии и медицине, описывающие работы, которые были проведены с использованием статистических методов исследования. Поиск велся пока лишь по публикациям, в которых содержатся библиографические ссылки на работы Финнея и Бейли - зарубежных статистиков и авторов монографий, широко используемых биологами. Результаты оказались следующими: по ссылкам на Финнея за 1965 г. было выявлено 198 биологических и медицинских работ, опубликованных в 1965 г., а по ссылкам на Бейли - 23 работы.
Нас интересовали также те прикладные работы, в которых используется метод максимума, предложенный академиком Л.С.Понтрягиным, метод динамического программирования, предложенный Р.Беллманом, а затем успешно развиваемый Р.Арисом в применении к задачам химии (решение задач такого типа, как оптимальное проектирование химических реакторов, в тех задачах, для которых известны математические модели процесса). Оказалось, что монография, в которой излагается метод максимума, цитируется 103 раза - 25 раз в отечественных журналах и 78 раз в иностранных, причем в основном в работах прикладного характера. Результаты изучения цитируемости работ Р.Ариса и Р.Беллмана приведены в табл.4.
Здесь обращает на себя внимание очень большое число химических работ, в которых используется метод динамического программирования. Интересно также то, что лишь в семи публикациях по химии одновременно цитируются оба эти автора. Неожиданным для нас оказалось наличие довольно большого числа ссылок на работы Р.Беллмана в физических журналах. Совсем неожиданным было цитирование этого автора в биологических и метеорологических журналах. Разумеется, эти результаты подлежат дальнейшему смысловому анализу, который позволит нам оценить возможность применения метода динамического программирования в новых областях.
К сожалению, в данном случае мы не можем сопоставить результаты поиска, проведенного по SCI, с результатами поиска по библиографическим указателям и реферативным [переход: стр.45-->стр.46] журналам. Здесь можно только отметить, что найденное нами число прикладных работ, использующих в той или иной степени идеи Л.С.Понтрягина или идеи Р.Беллмана, превзошло все наши ожидания.

Таблица 4.
Область науки цитируемой работы Число ссылок
на работы
Р.БеллманаР.Ариса
    Математика и теория автоматического
    управления
1908
    Химия 1573
    Физика 264
    Биология 3-
    Метеорология 21

Оценка вклада, вносимого отдельными учеными или научными коллективами в мировую науку. Мы провели большую работу по изучению частоты цитируемости публикаций двух групп ученых. Одна из них (малая группа) - это ученые, активно работающие над вопросами математической статистики. Другая группа (очень большая) - это академики АН СССР, занимающиеся практически всеми вопросами науки. Результаты этого исследования оказались очень интересными и подчас даже неожиданными. Не будем здесь останавливаться на анализе этих данных - это не относится к теме данной публикации. Укажем только, что в результате нашего опыта работы с SCI мы пришли к выводу, что:
пользуясь SCI, можно организовать систему обратной связи между автором и творчески активными читателями. Ученые должны регулярно получать списки тех публикаций, в которых содержатся ссылки на их работы, и таким образом узнавать, в какой области находят применение высказанные ими идеи. Объем научной информации сейчас настолько возрос, что авторы, пользуясь традиционными методами, не могут следить за ссылками на их публикации;
с помощью SCI можно следить за развитием отдельных [переход: стр.46-->стр.47] научных идей и научных школ и, что особенно важно, за проникновением новых методов исследования в смежные области знаний;
SCI можно использовать для выявления исторической преемственности идей;
распределение цитируемых работ (документов-источников) по годам дает возможность определять уровень запаздывания и преемственности идей как для отечественных, так и для зарубежных научных школ и направлений;
степень цитируемости работ отдельного ученого или целого научного коллектива - это мера вклада, вносимого им в мировую науку. Нам представляется, что степень цитируемости может рассматриваться как один из критериев эффективности труда ученых. Разумеется, что этим критерием нужно пользоваться с большой осторожностью и обязательно подвергать результаты количественного исследования дополнительно смысловому анализу.
Подробно все эти вопросы будут рассмотрены в отдельной публикации.
Некоторые замечания и предложения, возникшие в процессе работы с указателем SCI. Использование SCI для решения большого круга задач предполагает частое обращение к этому указателю. Поэтому большое значение имеет удобство пользования SCI. Отметим некоторые трудности, с которыми мы столкнулись при работе с SCI.
1. Для получения названий работ, содержащих определенные библиографические ссылки, нужно обращаться к "Source Index". Естественно, что при машинном поиске это не создает никаких затруднений. Однако при работе с печатным SCI вручную лучше иметь эти названия в основной части указателя. Тогда большой круг задач можно было бы свести к перепечатке или фотографированию соответствующих страниц SCI, а сейчас на отыскание и выписку 3-4 десятков заглавий тратится целый рабочий день. Правда, это привело бы к увеличению объема SCI в несколько раз. Однако связанное с этим увеличение стоимости SCI, по-видимому, будет не очень большим. Увеличатся лишь расход бумаги и время печатания, но не понадобится никаких дополнительных затрат на обработку исходного материала. Потребители же получат значительную выгоду.
Необходимо отметить, что даже при выпуске предлагаемого более подробного SCI все-таки целесообразно [переход: стр.47-->стр.48] сохранить "Source Index", имеющий самостоятельное значение как годовой авторский указатель к массиву обработанных журналов.
Возникает вопрос, нужен ли вообще печатный вариант SCI и не следует ли ограничиться его составлением на магнитных лентах и соответственно машинной обработкой информации, содержащейся в SCI. Ведь машина всегда может напечатать нужный фрагмент текста SCI, по которому можно будет вести неформальный поиск. Необходимость в таком поиске иногда возникает, например, ввиду ошибок, встречающихся в SCI.
Однако современный уровень развития и распространенности вычислительных машин в ближайшие годы, по-видимому, не позволит полностью отказаться от печатного варианта.
2. Слишком сокращены библиографические описания цитируемых работ. Даже при наличии списка работ автора нам не всегда удавалось определить, на какую из его работ делается ссылка.
3. В SCI учитывается лишь фамилия первого из соавторов. Этого достаточно для решения узкой задачи информационного поиска, когда ведется поиск ссылок на данную статью. Для решения более широкой задачи, когда имя некоторого автора отождествляется с определенной тематикой исследований, а также для определения распространенности идей данного автора предпочтительнее, чтобы указывались все соавторы. Правда, это ведет к увеличению объема SCI примерно в два раза.
4. Отсутствует единообразие в транскрипции русских фамилий, что ведет к потере части информации. Зная, например, фамилию Semenov (Семенов), потребитель, особенно - иностранец, может упустить из виду ее другие варианты - Semyonov, Semionov, Semjonov, Semenoff, Semenow и т.д.
В табл. 5 приведены различные варианты транскрипции букв русского алфавита, которые мы встретили в SCI.
По-видимому, ответственными за этот разнобой следует считать авторов и редакторов публикаций. В связи с изданием SCI и распространением других методов массовой обработки печатной информации этот вопрос приобретает большое значение. Поэтому весьма желательно, чтобы Международная организация по стандартизации все-таки завершила разработку единых правил [переход: стр.48-->стр.49] транслитерации кириллического письма, которые были бы обязательны для всех издателей мира. При настоящем же положении вещей приходится учитывать все возможные варианты транскрипции.

Таблица 5.
Русские
буквы
Варианты транскрипции, язык
английскийфранцузскийнемецкий
вvvw
гggug
еe, ye, iee, iee, je
ёe, yo, ioe, ioe, jo
жzhjzh
зzz, sz
йy, iij
сsss, ss
уuouu
цtststz, z, c
чch, tshtchtsch
шshchsch
щshchchtchschtsch
юyu, iuiouju
яya, iaiaja

5. Необходимо отметить, что в SCI много ошибок. Наиболее часты ошибки в инициалах. В русских фамилиях очень часто буква В транслитерируется латинской буквой В (вместо V), С - латинской буквой С (вместо S) и Р -латинской буквой Р (вместо R). Вместо двух инициалов часто приводится один или вообще не дается ни одного. Типична перестановка инициалов. Все эти ошибки следует учитывать при поиске. [переход: стр.49-->стр.50]

ВОЗМОЖНЫЕ НАПРАВЛЕНИЯ РАБОТЫ
С УКАЗАТЕЛЕМ ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ В СССР

Указатель цитированной литературы - сложное и дорогое издание. Его нельзя просто читать, как реферативный журнал. Он рассчитан на высококвалифицированных специалистов, и работа с ним требует больших интеллектуальных усилий. Результаты, полученные при всех видах использования такого указателя, нуждаются в глубоком осмыслении и тонкой корреляции. Указатели цитированной литературы имеют большую ценность для руководителей науки и ученых, определяющих стратегические направления научных исследований.
В нашей стране работа с указателями цитированной литературы должна развертываться в двух направлениях. Во-первых, необходимо использовать американский SCI для информирования советских ученых - академиков и руководителей проблемных советов и научно-исследовательских институтов АН СССР и т. д., а также для анализа структуры фронта научных исследований.
Во-вторых, необходимо приступить к составлению собственного указателя цитированной литературы, так как для SCI обрабатывается всего 28 советских журналов, которые регулярно переводятся на английский язык и издаются в США и Великобритании. В то же время для SCI расписываются 559 журналов США, 170 журналов Великобритании и 49 журналов Японии. Для сравнения укажем, что всего в СССР 1745 научно-технических журналов, в США 6200, в Великобритании 2200 и в Японии 2800. Поскольку в SCI расписывается 1500 названий журналов, издаваемых в 39 странах мира, этот указатель может быть использован нами как система для поиска соответствующих зарубежных публикаций, а также как инструмент для изучения распространения идей советских авторов за рубежом.
Составление   с о в е т с к о г о   у к а з а т е л я   ц и т и р о в а н н о й   л и т е р а т у р ы   должно обеспечить прежде всего охват советских научно-технических публикаций, что даст возможность получить ответы на вопросы, на которые не отвечает американский указатель. Наш указатель цитированной литературы должен позволять отыскивать соответствующие публикации советских авторов и по этим публикациям изучать структуру исследовательского фронта советской науки. Отсюда следует, что он должен [переход: стр.50-->стр.51] составляться на основе информации, получаемой путем обработки только советских журналов. При этом на первом этапе могут учитываться лишь ссылки на советские работы; на втором этапе могут учитываться также и ссылки на зарубежные работы, что расширит базу исходных работ для поиска и позволит учитывать распространение идей зарубежных авторов в СССР.
Обратимся к цифрам, характеризующим объем работ, необходимых для выпуска советского указателя цитированной литературы. В 1965 г. в СССР издавалось 3846 названий периодических изданий. Из них научно-технических журналов насчитывалось 1745 (582 по естественным наукам и 1163 по технике). В SCI расписывается около 4-5% всех научно-технических журналов мира (1,5 тыс. названий из 30-35 тыс.). Исходя из анализа общих закономерностей распределения научных публикаций по их значимости, вначале можно было бы ограничиться обработкой 100 - 120 советских журналов, что составляет 5-6% всех периодических изданий по науке и технике, выходящих в СССР.
На первом этапе эти журналы могли бы быть выбраны по рекомендациям авторитетных ученых, а в дальнейшем - по частоте их упоминаний в ссылках. При этом для сопоставимости результатов с американским SCI обязательно следует включить в их число расписываемые для SCI 28 названий советских журналов. 120 названий журналов в год должны давать около 330 тыс. ссылок. Если считать, что половина из них приходится на иностранные работы, то тогда число ссылок на советские публикации за год составит 165 тыс. Для осуществления первого этапа работы вполне пригодны любые серийные ЭЦВМ. Однако наилучшие результаты, по-видимому, могло бы дать применение ЭЦВМ типа "Минск-22", так как ее алфавитно-цифровое печатающее устройство имеет строку длиной в 128 знаков. Это означает, что в советском указателе цитированной литературы можно было бы отказаться от деления на две части и сразу давать заглавие публикации (хотя бы и усеченное до ключевых слов).
Несколько слов о перспективах этой работы. После создания советского указателя цитированной литературы можно было бы договориться об обмене магнитными лентами с фирмой Institute for Scientific Information, [переход: стр.51-->стр.52] возглавляемой Ю.Гарфилдом. Это позволило бы нам получить информацию, предназначенную для отдельных абонентов, непосредственно с выходных устройств ЭЦВМ. Кстати говоря, подобное информационное обслуживание уже осуществляется указанной фирмой в двух аспектах - тематическом и авторском.
Второе направление работ - это организация постоянно действующей системы по слежению с помощью указателей цитированной литературы за развитием науки. Сейчас обсуждается вопрос о создании при ВИНИТИ специальной информационной группы для работы с указателями цитированной литературы. Эта группа могла бы выполнять следующие задачи:
1) производить библиографический поиск по таким разделам науки, за развитием которых трудно следить по реферативным журналам. В первую очередь это относится к проникновению математических методов исследования в другие науки - химию, техническую физику, металлургию, биологию, агрономию, медицину и экономику. Одновременно с выдачей библиографий можно проводить тщательный количественный анализ этого процесса, т.е. сравнительную оценку скорости проникновения математических методов по разным странам;
2) следить за возникновением, расцветом и упадком отдельных научных школ и направлений путем наблюдения за степенью цитируемости публикаций отдельных научных коллективов;
3) определять уровень запаздывания в преемственности идей по распределению цитируемых работ по годам;
4) выдавать справки о цитируемости публикации отдельных ученых по их запросам. Как говорилось, это позволит установить систему обратной связи между автором и творчески активными читателями.
В заключение необходимо подчеркнуть, что указатель цитированной литературы было бы неправильно рассматривать только как информационно-поисковую систему. Такой указатель явится также очень ценным инструментом для изучения структуры исследовательского фронта науки и для объективной оценки эффективности научных исследований. В частности, уже по материалам первого года можно было бы дать обоснованную оценку значимости советских журналов и научных школ. [переход: стр.52-->стр.53]
Считаем своим долгом выразить благодарность В.В.Налимову и А.И.Михайлову за постановку задачи и интерес к работе, а также сотрудникам статистической лаборатории МГУ М.К.Ивочкиной и Н.К.Тарасюк за помощь в практической работе с SCI.
          Литература
    1.   Shepard's Citation. Chicago, 1873.
    2.   E.Garfie1d. Citation indexes for science.- Sci. 1955, 122, N 3, p.108-111. E.Garfield. Science citation index - a new dimension in indexing.- Sci. 1964, 144, p.649-654.
    3.   E.M.Keen. Citation indexes.- ASLIB Proc., 1964, 16, N 8, p.256-251.
    4.   E. Garfield, I.Sher and R.Torpie. The use of citation data in writhing the history of science. Philadephia, Inst. for Sci. Inform., 1964, 75.
    5.   I.Asimov. The genetic code. New York, New Am.Libr., 1963.
    6.   E.Garfield and I.Sher. New factors in the evaluation of scientific literature through citation indexing.- Am. document., 1968, 14, N 3, p.195-201.
    7.   M.Kessler. Bibliographic coupling between scientific papers.-Am. document., 1968, 14, N 1, p.10-25.
    8.   J.Tukey. Keeping research in contact with the literature: citation indexes and beyond. - IRE Transact. engin. in writt. and speech, 1962, 5, N 2, p.78-82.
    9.   D. de S.Price. Networks of scientific papers.- Sci, 1965, 149, N 3683, p.510-515.
    10.  Science citation Index, 1965, Guide & Journal List. Philadelphia, 1965, p.82.
    11.  R.Bruton and R.Kebler. The  half-life  of some scientific and technical literature.- Am. document., 1960, 11, N 1, p.18-22.
    12.  Ch.Brown. Scientific serials. Characteristics and lists of most cited publications. Chicago, ACRL, 1956, 189p.
    13.  J.Martyn. An examination of citation indexes.- ASLIB Proc., 1965, 17, N 6, p.184.

Опубликовано в сборнике:
Прикладная документалистика / АН СССР. Науч. совет по кибернетике. - М.: Наука, 1968. - С.32-53, 1 рис., 5 табл. - Библиогр.: с.53 (13 назв.) - (Сер. Организация и управление).

Материалы по Индексу цитирования

* * *


[О библиотеке | Академгородок | Новости | Выставки | Ресурсы | Библиография | Партнеры | ИнфоЛоция | Поиск | English]
  Пожелания и письма: www@prometeus.nsc.ru
© 1997-2019 Отделение ГПНТБ СО РАН (Новосибирск)
Статистика доступов: архив | текущая статистика
 

Документ изменен: Wed Feb 27 14:54:50 2019. Размер: 80,014 bytes.
Посещение N 4231 c 15.02.1999