Прайс Д.С. Квоты цитирования в точных и неточных науках, технике и не-науке (1971)
Навигация
Научные сообщения и публикации
(Вопросы философии, 1971, N 3, С.149-155)
-----------------------------------------------------------------------------------------------------------------------------------------------
КВОТЫ ЦИТИРОВАНИЯ
В ТОЧНЫХ И НЕТОЧНЫХ НАУКАХ,
ТЕХНИКЕ И НЕ-НАУКЕ
Д.С.Прайс (США)
   1971


ОТ РЕДАКЦИИ. Объем информации во всех областях знания и культуры стремительно растет. В условиях научно-технической революции возрастает и значение научной информации. Однако "информационный взрыв" угрожает сделать поток новой и ранее созданной информации труднодоступным, а иногда и избыточным. Исследователи науки в разных странах, в том числе и в Советском Союзе, в течение ряда лет стремятся сделать обращение информации объектом научного исследования с целью установить определенные закономерности циркуляции знания. Предлагаемая статья известного американского исследователя науки, по нашему мнению, способствует уточнению представлений о количественной и качественной сторонах использования научной информации. Статья дается с небольшими сокращениями.

Основная проблема, рассматриваемая в этой работе, связана с тем, что обычно к научной информации относят не только информацию, обладающую научным содержанием. Эта проблема чем-то напоминает затруднения человека, который хочет написать книгу о китайской медицине, прочитав предварительно одну книгу о Китае, другую - о медицине и "объединив" свои знания. Научная литература отличается от остальной литературы еще в большей степени, чем китайская медицина - от остальной медицины, и, как я полагаю, отличие определяется не только различием содержания, но и той особой социальной ролью, которую играет ученый.
Мне, как историку науки, хорошо известно, что самыми значительными своими успехами техника обязана не столько прикладным, сколько фундаментальным теоретическим исследованиям, нацеленным на глубокое понимание действительности и вооруженным самыми современными средствами анализа. В связи с этим мне кажется, что и статистические материалы и вычислительная техника могут принести в фундаментальных исследованиях не меньше пользы, чем в решении практических задач, для которых они предназначены. Ясно, однако, и то, что только новый подход, а не ориентация на конкретные частные результаты может привести к успеху. Эти соображения и заставили меня рассмотреть вышеуказанную проблему.
Что же, кроме различия в содержании, отличает научную информацию от всякой другой? Следует отметить, что исследование этого вопроса стало возможным после введения новых и важных измеримых характеристик научной литературы [1], созданных на основе статистических данных (Science Citation Index - SCI), которые по объему и точности превосходят все данные подобного рода, имевшиеся у нас до сих пор. Возникла задача превратить эти новые характеристики в своеобразный индикатор, способный указывать нам на степень научности той или иной области знаний.
В работе Дейча [2], ставшей уже классической, подробно исследуется предположение Конанта о том, что существование двух различных типов знания связано с кумулятивностью одного из них и некумулятивностью другого, причем кумулятивность науки вызвана ее особой, жесткой и целостной структурой. Гуманитарные науки, хотя и включают в себя ряд особенностей, свойственных точным наукам, подобной кумулятивной структурой не обладают.
Ряд эмпирических оснований для такого качественного анализа был введен Сторером [3], который исследовал точные и неточные науки и ввел термин "не-наука". Он показал, что наши интуитивные представления об этих типах знания могут быть оформлены в виде шкал, построенных на количественной основе, например, на количестве ссылок на имена авторов.
Другим показателем, который можно использовать для отличия точных наук от неточных, может стать нечто, отражающее социальную роль каждого из этих типов знаний. Характер подготовки студента в университете определяется тем, будет ли он использоваться в будущем на преподавательокой работе или непосредственно в науке. Например, в истории и философии большую часть потенциальных ученых ожидает после написания ими диссертации карьера преподавателя. Обществу важно здесь то, что студенты превращаются в преподавателей, которые обучают студентов, а научная работа в этом случае является зпифеноменом. На самых "точных" факультетах университетов, напротив, лишь 20% написавших диссертации возвращается в систему образования, общество интересует в данном случае не столько обучение новых студентов, сколько использование молодых ученых вне университета. Если взять теперь в качестве индекса относительное количество "возвращенных" в систему образования, мы получим шкалу со следующим упорядочением наук: точные, неточные, гуманитарные [4]. Дальнейшие исследования показали, что средняя норма "возвращения" в университеты США составляет приблизительно 50% и что для ежегодного выпуска 15 новых докторов требуется около 100 преподавателей с докторской степенью [5].
Другая группа сходных социальных параметров была введена У.Хегстроном [6], который,в частности, показал,что распределение "точные науки - гуманитарные науки" совпадает по направлению с убыванием числа согласий с суждением: "профессора часто эксплуатируют аспирантов". Возможно, менее эмоционально насыщенным является его открытие, что каждый тип знаний имеет свою специфическую форму распределения количества публикаций по научным статьям, обзорным статьям и книгам.
С этой точки зрения очевидно, что мы не можем и не должны искусственно отделять содержание публикаций от социальной коммуникации между их авторами, изменяющихся со временем. Так, например, во времена Галилея почти невозможно было найти книгу, написанную не древним классиком, а современным автором; научная же революция середины ХVII века привела не только к созданию научных академий, но и к созданию научных журналов и публикациями статей. Со временем социальные отношения ученых изменяются еще больше, и это происходит главным образом потому, что точное знание объединяет способности и возможности многих людей, а наука строит это объединение таким образом, что совместное знание может расти гораздо быстрее, чем знание любого отдельного индивида.
Гуманитарное знание, основанное на возможностях отдельных индивидов, не способно на подобную определенность и столь быстрый рост, поэтому, как только объективные методы и математика открывают нам путь к достоверности, мы тотчас отказываемся от методов гуманитарных наук. Именно таким путем натурфилософия превратилась в науку, и, в общем, таким же путем были созданы различные социальные механизмы организации информации и коммуникации для различного типа знаний.
Теперь перейдем от приблизительных рассуждений по этому поводу к более достоверной или по крайней мере к более строгой формулировке проблемы. Научная публикация является не столько информацией как таковой, сколько выражением наличного в данный момент в науке положения ученого или группы ученых. Мы не можем, несмотря на распространенное мнение, опубликовать факт, теорию или открытие, не подразумевая публикации целого их комплекса. Научная статья содержит в одно и то же время - и больше и меньше, чем некоторую концепцию, факт или гипотезу. Если же статья выражает положение индивида или группы индивидов на переднем крае науки, то уже на основании самих статей можно утверждать нечто об отношениях между этими индивидами.
Именно поэтому библиографические ссылки, так же как состав и порядок соавторов, выступают в качестве указателей на социальные связи. Хирш и Синглтон [7] в работе, долго остававшейся неопубликованной, показали, что количество соавторств в некоторой области науки коррелирует со способом и объемом ее финансирования. Исследования, проведенные мной, также указывают на то, что сотрудничество авторов возникает не столько на интеллектуальной, сколько на экономической почве. Во всяком случае, количество соавторств указывает не более чем на экономическую ценность, приписываемую обществом данному типу знаний, и поэтому в хорошо финансируемой гуманитарной науке соавторств может быть столько же, сколько, скажем, в физике высоких энергий; примером этого может служить положение в урбанистике.
Удобным индексом социальной связи оказывается также общее количество библиографических ссылок в статье. Я не считаю, конечно, что статьи с дюжиной библиографических ссылок более научны, чем те, которые содержат их только десять, или что все статьи, имеющие по десять ссылок, сходны по степени научности, но хочу обратить внимание на следующие три вопроса:
1) Почему нормой научности статьи является квота в 10-22 ссылки?
2) Какие типы статей находятся значительно выше этой нормы?
3) Какие типы статей находятся значительно ниже этой нормы?
На первый вопрос я не могу ответить и только замечу, что при нынешнем темпе роста массива публикаций (7% в год) общее количество ссылок является величиной того же порядка, что и число наличных публикаций в массиве. Отсюда вытекает, что в среднем по массиву на каждую статью ссылаются один раз в год. Во всех областях науки наблюдается медленный, но постоянный рост количества ссылок. Паркер установил, что для социальных наук среднее количество ссылок в одной статье увеличилось с 8,4 и 9,4 в 1950 и 1955 гг. до 15,2 и 15,5 в 1960 и 1965 гг.
Что касается второго вопроса - об "очень научных" статьях, то оказывается, что статьи с очень большим количеством ссылок не являются собственно-научными, а принадлежат скорее к обзорным статьям, открывающим доступ к последним публикациям в той или иной области, кратко пересказывая их содержание. Это верно, по-видимому, как для эстетики, истории, литературоведения, так и для международного права и даже для более точных наук, таких, как физика и биохимия. Единственное новое открытие, о котором я хочу сказать, состоит в том, что различие между обзорными и исследовательскими статьями оказалось не столь значительным, как этого можно было бы ожидать: оба типа статей незаметно переходят друг в друга.
Третий вопрос оказывается более плодотворным - научных статей с почти полным отсутствием ссылок существует великое множество, даже в столь академических науках, как экономика и математика. Обычно такие статьи без ссылок появляются тогда, когда ученый-исследователь на основании своих собственных знаний объявляет ex cathedra о том, что нечто есть или каким оно должно быть. По-видимому, любой тип знаний является подходящим местом для таких объявлений, но следствием этого может оказаться некумулятивность знаний. Определение научности, данное мной, можно рассматривать не только как описание, но и как предписание для кумулятивной системы знания.
Количество ссылок само по себе не может, конечно, указать нам на ожидаемое различие между наукой и не-наукой, между точными и неточными науками, поэтому нам необходим некоторый показатель качественного строения системы ссылок.
В моей первой работе о сетях цитирования [8] я показал, используя данные "Science Citation Index" для миллионов статей, что существует две популяции ссылок, частично перекрывающие друг друга. С одной стороны, это ссылки на "архивную" литературу, как старую, так и новую, распределенные довольно равномерно и медленно уменьшающиеся по мере старения литературы. С другой стороны, это ссылки на литературу "оперативного воздействия", сравнительно современную и находящуюся на переднем крае исследований.
Увеличение количества ссылок на архивную литературу (свыше 15-20-летней давности) хорошо соответствует увеличению количества этой литературы. В современной работе ссылки на статьи 1913 года будут встречаться в два раза чаще, чем на статьи 1900 года, так как в 1913 году статей было опубликовано в два раза больше, чем в 1900. Количество ссылок на одну опубликованную статью падает - по мере конденсации и устаревания знания - и уменьшается вдвое через каждые 20 - 30 лет. Не следует забывать, однако, что количество статей, содержащих ссылки, увеличивается по экспоненте, удваиваясь через 10 лет, и, следовательно, цитируемость некоторой архивной статьи уменьшается вдвое через каждые 10 лет, так что только соответствие между ростом литературы и ее старением позволяет сохранять средний темп цитирования - одна ссылка в год - на архивную статью, как уже говорилось.
Ссылки на литературу "оперативного воздействия" оказывают в течение ближайших нескольких лет значительно большее воздействие на динамику ссылок, чем естественный рост литературы или ее нормальное устаревание. При этом текущий и прошедшие годы можно не принимать в расчет, так как в эти годы идет процесс усвоения информации и публикации статей, содержащих ссылки. Статьи двухлетней давности цитируются в 6 раз чаще, чем этого требует средняя архивная норма, трехлетней - в 5 раз, девятилетней - в 3 раза, причем эти цифры являются усреднением по всем типам наук и могут, конечно, изменяться от типа к типу. Следствием эффекта "оперативного воздействия" является то, что количество ссылок убывает со временем гораздо быстрее, чем при нормальном уменьшении вдвое через каждые 13,5 лет, определенном по статистическим данным. Согласно "SCI", для ссылок на недавние публикации время уменьшения вдвое равно 5 годам. Мак Рай [9] получил это же число для социологии и неточных наук, но для физики и биомедицинских наук такое уменьшение ссылок вдвое происходит через 3 года. Стоддарт [10] определил "половинную жизнь" ссылок в географии: в 16 лет - для архивной литературы в 1954 году и в 4 года - для литературы оперативного воздействия в 1967 году.
По моему мнению, однако, более важной характеристикой, чем "половинная жизнь" ссылок, является отношение количества "оперативных" ссылок к количеству "архивных" ссылок. Мидоуз [11] предложил в качестве подобного индекса отношение количества ссылок на литературу не более чем 6-летней давности к количеству ссылок на литературу более чем 20-летней давности, но я нахожу подобные усложнения малополезными. По-видимому, вполне разумным будет взять в качестве индекса отношение количества ссылок на литературу не более чем 5-летней давности к общему количеству ссылок. Период в пять лет выбран мной по следующим причинам: если взять 10 лет, то, даже не учитывая немедленного воздействия, мы получим 50% увеличения числа ссылок за счет экспоненциального роста литературы; трех же лет совершенно недостаточно, так как в течение первых двух лет статья вообще плохо известна и мало распространена. Таким образом, период в 5 лет является самым подходящим.
Для оценки границ этого параметра заметим, что рост количества публикаций со скоростью 5% в год приводит к удвоению литературы через 13,9 года, а количество литературы, опубликованной за последние 5 лет, составляет около 22% от всего, что было опубликовано. Наибольшая известная скорость увеличения литературы в отдельных областях науки составляет 10% в год, с периодом удвоения в 6,9 года и с 39% всей литературы, опубликованной за последние 5 лет. Таким образом, индекс Прайса (как я назвал введенный параметр) изменяется от 22% для нормального до 39% для быстрого роста архивной литературы.
Трудно определить значение этого индекса для литературы "оперативного воздействия", но я полагаю, что он находится в пределах 75 - 80% и также зависит от скорости роста литературы.
Любое объединение двух типов ссылок скажется на значении индекса Прайса, причем это значение (как и количество ссылок на одну статью) вовсе не обязательно вычислять для всей области науки, допустимо микро- и макроиспользование этих показателей для оценки журнала, института и даже отдельного индивида или отдельной статьи. Например, я могу заранее сказать про статью, которую вы сейчас читаете, что она будет содержать около 16 ссылок, причем только 2 или 3 из них будут относиться к работам, опубликованным до 1963 года.
Изучение статистических данных "SCI" показало, что индекс Прайса по всем типам наук равен примерно 50%, откуда следует, что около половины ссылок в "SCI" относится к архивным статьям, а другая половина - к "оперативным" статьям. Это означает, что на каждые 100 архивных статей приходится ежегодно 7 новых, содержащих 100 ссылок, из которых половина относится к архивным статьям.
Таким образом, вероятность ссылки на архивную статью в течение года равна 1/2, и, следовательно, около половины архивных статей (в действительности около 40%) не цитируется в течение года в ссылках. На 30 статей "оперативного воздействия", опубликованных в последние 5 лет, приходятся оставшиеся 50 ссылок, что дается в соответствии со статистическими данными "SCI" в среднем 1,67 ссылки на одну статью.
Возможно, самым важным из сделанных открытий является то, что шкала, полученная упорядочением значений индекса Прайса по отдельным типам знаний, хорошо соответствует нашим интуитивным представлениям о точных и неточных науках и не-науке. В верхней части шкалы с индексом 60-70% находятся журналы по физике и биохимии, немного ниже - издания [12] вроде "Radiology" (58%) и "American Journal of Rentgenology" (54%). Индекс "American Sociological Review" равен 46,5%, а Паркер показал, что значения индекса для социальных наук концентрируются вокруг 41,9+1,2%.
Мои вычисления медианы и квадрилей, основанные на данных 154 журналов из самых различных областей, дали соответственно 32, 21, 42%. Для некоторых областей науки было обнаружено медленное возрастание индекса Прайса со временем, но значение индекса по всем данным "Science Citation Index" уменьшается за счет включения неточных наук.
Вне всякого сомнения, журналы с индексом, превосходящим верхнюю квадриль (42%), относятся к точным наукам. На противоположном конце шкалы я, к своему удивлению, обнаружил значительное количество журналов с индексом, меньшим индекса архивной литературы. К ним относятся, например, "German Review"," American Literature","Studies in English Literature", "Isis", индекс которых меньше 10%. Следует, однако, помнить, что для целого ряда наук имеются особые причины для ссылки на старую литературу, которая является, собственно, областью их исследований.
Если отбросить из рассмотрения подобные случаи, то рассматриваемый индекс оказывается вполне хорошим диагностическим средством. Низкий индекс указывает на гуманитарный тип исследований, при котором ученый усваивает сначала все известное до него по данному вопросу, потом дает усвоенному "созреть" в своем разуме и, наконец, извлекает из него новое решение. В точных науках позитивный характер знания и его кратковременность позволяют усвоить мудрость прошлого еще в студенческие годы и тут же обратиться к непосредственным исследованиям, для которых контакт с современниками не менее важен, чем традиционные знания.
Я уже говорил о том, что считаю эту работу не только описательной, но и предписательной, и поэтому хочу рассмотреть в заключение несколько практических советов, которые из нее следуют.
На индивидуальном уровне и автор и издатель должны соблюдать осторожность в использовании ссылок, как это делается, например, при наименовании статей или при составлении списков авторов. Нельзя позволять автору исследовательской статьи уклоняться от контакта с коллегами, ссылаясь на слишком небольшое количество их работ, в случае же, когда ссылок становится слишком много, публикация превращается из исследовательской статьи в обзорную.
На уровне системы рассмотренные индексы дают указание о свойствах, которыми должна обладать информационная служба.
В общем, точная и неточная наука, техника и не-наука являются различными социальными системами, и каждая из них имеет свой собственный механизм для управления процессом публикаций и коммуникаций среди исследователей.

ПРИМЕЧАНИЕ. К статье Д.С.Прайса приложена таблица, состоящая из списка 154 американских и европейских журналов и схемы, на которой точками обозначены индексы этих журналов. Публикация всей этой таблицы не много скажет читателю нашего журнала, так как в ней собраны издания по всем возможным специальностям. Однако сам принцип получения индексов Прайса и построения соответствующей схемы, безусловно, представляет интерес для советского науковедения. Поэтому мы приводим ниже фрагмент схемы и таблицы.
Фрагмент схемы


Название Среднее
количество
ссылок
% ссылок
в течение
последних
5 лет
9     American Journal of Botany 18 21
10     American Journal of Economics & Sociology 18 17
15     American Journal of Sociology 17 60
21     American Sociological Review 11 49
29     Anesthesie Analgesie Reanimation 16 36
42     Astrophysical Journal 20 66
45     British Journal of Psychology 16 21
88     Isis 18 8
114     Journal of Political Economy N II 17 38
115     Journal of Political Economy N III 15 24
116     Journal of Political Economy N IV
и т.д.
20 72


В левом столбце таблицы по линии ординат проставлены по вертикали деления от 2 до 90, соответствующие среднему количеству ссылок в журнале. Внизу по линии абсцисс проставлены значения количества ссылок в течение последних 5 лет (в %%) от 10 и выше. В этой системе координат каждый журнал получает соответствующее место, помеченное порядковым номером в списке. В схеме, далее, выделены центральная и периферийная зоны. Большая часть журналов располагается в центральной зоне как с точки зрения среднего количества ссылок, так и с точки зрения % ссылок в течение лоследних 5 лет (в приведенном фрагменте помечается лишь часть названий).
            П р и м е ч а н и я
    1.  Edwin B.Parker, William J.Paisly, and Roger Garrett. Bibliographic Citations and Unobtrusive Measures of Scientific Communication. Stanford University Institute for Communication reasearch, October 1967.
    2.  Karl W.Deutsch. Scientific and Humanistic Knowledge in the Growth of Civilisation. In: Harcourt Brown (ed.) Science and the Creative Spirit. Univ.of Toronto Press, 1958, pp.3-51.
    3.  Norman W. Storer. The Hard Sciences and the Soft: Some Sociological Observations. Bulletin of the Medical Library Association. Vol.55, 1967, pp.75-84.
    4.  Kenneth M.Wilson. Of Time and the Doctorate. Southern Regional Education Board Research Monograph N 9, Atlanta 1965. See especially Table 1.2, p.14.
    5.  Richard H.Bolt, Walter L.Koltun, Oscar H.Levine. Doctoral Feedback into Higher Education. Science, Vol.148, 14 May 1965, pp.918-928.
    6.  Warren O.Hagstron. The Scientific Community Basic Books,Inc. (publishers). New-York - London, 1965.
    7.  Walter Hirsch and James Singleton. Research Support, Multiple Authorship, and Publication in Sociological Journals, 1936-1964, unpublished report, Purdue University, 1964.
    8.  Derek J. de Solla Price. Networks of Scientific Papers. "Science", July 30, 1967, pp.510-515.
    9.  Duncan MacRae, Gr. Growth and Decay Curves in Scientific Citations, preprint from University of Chicago, April, 1969.
    10.  D.R.Stoddart. Growth and Structure of Geography. Transaction and Papers of the Institute of British Geographers, 1967, Publication N 41, 19 pp.
    11.  A.J.Meadows. The Citation Characteristing of Astronomical Research Literature. Journal of Documentation, Vol.23, March 1967, pp.28-33.
    12.  См. E.R.N.Grigg. Information Science and American Radiology, Radiologic Technology, Vol.41, 1969, pp.19-30.

Опубликовано в журнале:
Вопросы философии. - 1971. -
N 3. - С.149-155.

Автор статьи - Прайс Дерек Джон де Солла (Price Derek John De Solla, 1922-1983) - на момент публикации - профессор Йельского университета (г. Нью-Хевен), член Международной академии по истории науки.

* * *


[О библиотеке | Академгородок | Новости | Выставки | Ресурсы | Библиография | Партнеры | ИнфоЛоция | Поиск]
  Пожелания и письма: branch@gpntbsib.ru
© 1997-2024 Отделение ГПНТБ СО РАН (Новосибирск)
Статистика доступов: архив | текущая статистика
 

Документ изменен: Wed Feb 27 14:54:50 2019. Размер: 47,404 bytes.
Посещение N 12467 с 09.10.1998