Data mining pubmed и pubchem

0:00, 2 мая 2020
'Data mining pubmed и pubchem
0 10 мин.

Содержание

Кроме данных по MEDLINE, PubMed предоставляет доступ к:

  • старых ссылок из печатных версий Index Medicus с 1951 года и ранее;
  • ссылки на некоторые журналы, прежде чем они были проиндексированы в Index Medicus и MEDLINE, например, Science, BMJ, и Annals of Surgery;
  • очень свежие записи статей, прежде чем она индексируются в Medical Subject Headings (MeSH) и добавляются в MEDLINE;
  • коллекция доступных полнотекстовых книг и другие данные NLM

Многие абстрактов в PubMed содержат ссылки на полные тексты статей, и некоторые из которых находятся в свободном доступе, часто в PubMed Central и местных зеркал, таких как UK PubMed Central.

Информация о журналах, индексируемых в PubMed, находится в NLM Catalog

По состоянию на 14 апреля 2012 PubMed имеет более 21,70 миллионов записей, начиная с 1966 года, и выборочно даже с в 1865 году и очень выборочно — с 1809; ежегодно добавляются около 500 000 новых записей. 12380000 из этих статей приведены с резюме, а также 12810000 статьи имеют ссылки на полный текст (в том числе 3540000 статьи доступны полнотекстовой, бесплатно для любого пользователя). Чтобы увидеть текущий размер базы данных, введите «1800 2100 » или «all » в окне поиска PubMed

База данных доступна через двигатель NCBI-Entrez — центральную поисковую систему важнейших медицинских баз данных, включая также OMIM, PubChem и другие. Каждая статья является проиндексирована в системе медицинских предметных рубрик.

PubMed документирует медицинские и биологические статьи из специальной литературы, а также дает ссылки на полнотекстовые статьи.

PubMed предоставляет бесплатный доступ к статьям в базе данных MEDLINE и также в некоторые журнальные статьи, не относятся к ней. PubMed также обеспечивает доступ к тематическим веб-сайтов, и других проектов NCBI. В PubMed, в основном, публикуются рефераты статей, документов. В каждой статье присутствует ссылка на журнал издательства, в котором появилась статья — там, где в некоторых случаях можно получить и полную версию, — а иногда и к проекту PubMed Central, где она находится в свободном доступе.

PubMed включает в себя данные из следующих областей: медицина, стоматология, ветеринария, психология, биология, генетика, биохимия, цитология, биотехнология, биомедицина и т. Д. Документированной около 3800 биомедицинских изданий. Ежегодно база данных PubMed увеличивается на 500 000 документов. Поиск происходит по принципу Medical Subject Headings (MeSH). По состоянию на апрель 2008 года база составляла около 5200 журналов из более чем 80 стран

Каждой статье присваивается идентификационный номер PubMed-ID (PMID).

Configuration[edit]

$wgPubmedCache=»/tmp/pubmedcache»; enables cacheing of the Pubmed article data in a directory

$wgPubmedLimit=0; means that you get all articles a search query returns (remember the Pubmed limit of 500 articles)
$wgPubmedLimit=10 sets the global limit of max retrieved articles to ten / can override the global setting

$wgPubmedLayoutFile=»layout_ext.def»; sets the global default layout file can override the default setting

$wgPubmedLayoutLinks=»PMID,WORLDCAT,EZB,DOI»; sets default link includes

… sets a limit of max data set that should be listed if there are more than one

… sets an alternative layout template file

События в мире

31-01-2020

Samsung изобрела смартфон в форме печеньяSamsung запатентовала смартфон с довольно необычной внешностью. Он имеет форму печенья, ну, или игровой консоли Sony PlayStation Portable (PSP).

31-01-2020

Apple заплатит штраф в 837 миллионов долларовБолее 1,1 млрд долларов компенсации присудил суд в США Калифорнийскому институту технологий (CalTech) за нарушения его патентов IT-гигантами Apple и Broadcom.

13-12-2019

Новые цифровые сервисы Роспатента начнут работать в мае 2020 годаЗаместитель руководителя федеральной службы по интеллектуальной собственности (Роспатент) Юрий Зубов сообщил о цифровизации некоторых сервисов ведомства в следующем году.

13-12-2019

Верховный суд отказал «Росгосстраху» в иске на 151 млрд р.Коллегия Верховного суда РФ оставила в силе решение московского арбитража об отказе в иске «Росгосстраха» к «Капитал Лайф Страхование Жизни» на 151 млрд р. Для этого пришлось отменить постановление Суда по интеллектуальным правам о новом рассмотрении дела.

13-12-2019

Суд подтвердил отказ в признании обозначения «Туполев» общеизвестным в РФСуд по интеллектуальным правам (СИП) подтвердил отказ ПАО «Туполев» в признании словесного обозначения «Туполев» общеизвестным в РФ товарным знаком в отношении товаров 12 класса МКТУ («самолеты»)

тарифные планы

Тариф

Для кого

Для чего

Приоритет (выполнения объёмных задач, поддержки и проч.)

Поиск в PubMed

Количество лит.источников в результатах поиска / Отслеживание публикаций

Сохранение результатов поиска в подборку

Выгрузка результатов поиска

Машинный перевод заголовка и текста абстракта на любой из 90 мировых языков

«Перебивка» библиографических ссылок в тексте пользовательской статьи по пользовательским спискам
литературы

Поиск в PubMed по пользовательским источникам литературы

Получение подборки источников литературы от другого пользователя для дальнейшей работы

Передача подборки источников литературы другому пользователю для дальнейшей работы

Поиск FULL TEXT

Стоимость подписки

Начальный

Студенты

Написать реферат, курсовую, краткий обзор литературы или обновить библиографию доклада
(презентации): охват основных источников по научной теме.

Безлимитно
Не более 20 / без отслеживаний

200₽100₽/30 дней

Купить тариф

Базовый

Ординаторы, аспиранты, соискатели, врачи

Для работы над диссертацией, изучения и разработки научного направления: достаточный охват
источников для формирования объективного мнения о состоянии проблемы.

Базовый

Безлимитно

Не более 50 / без отслеживаний

400₽200₽/30 дней

Купить тариф

Оптимальный

Научные сотрудники,
соискатели, врачи, профессорско-преподавательский состав кафедр ВУЗов

Для полноценной, в т.ч. командной, разработки научных тем, регулярной работы с научной
литературой из разных областей клинической медицины: широкий охват источников, изучение
библиографий сторонних статей и т.п.

Высший

Безлимитно

Не более 70 / одно отслеживание

550₽300₽/30 дней

Купить тариф

Продвинутый

Ведущие научные
сотрудники, крупные
ученые, руководители
научных подразделений
учреждений и кафедр ВУЗов

Для максимально полноценного взаимодействия с научной средой: максимальный охват
литературных
источников, отслеживание публикаций по темам, формирование исчерпывающего представления о
состоянии проблемы.

Наивысший

Безлимитно

Не более 100 / до пяти отслеживаний

700₽400₽/30 дней

Купить тариф

Changelog[edit]

Version 1 — SOAP interface

  • 01.12.2008: small bugfix in SOAP class
  • 07.07.2009: Add ProxyUser and ProxyPassword to code area that handles a SOAP proxy connection
  • 28.04.2010: Try to code a work around for the mismatch encoding information in the SOAP-data coming from Pubmed. Adding 2 new variables: $wgPubmedSOAP=»nusoap»; that can be «auto or nusoap» and $wgNUSOAPencodinghack=true; At the moment only $wgPubmedSOAP=»nusoap» is working correctly.
  • 28.12.2010: Fix Pubmed changing in Title: Unfixed ‘Array’ occurs in titel. This is fixed in layout.inc.php now.
  • 08.02.2011: Fix Pubmed changing in : Cache function was worry about…
  • 11.02.2011: Version is outdated and not longer supported. Please update to version 2.

Version 2 — fcgi interface

  • 11 Feb 2011: Doing a complete redesign of the API. The SOAP-interface (used in Version 1) of Pubmed causes more problems than clouds in the sky. The redesigned extension uses the fcgi-interface and xml.
  • 11 Feb 2011B: Minor bugfix in proxy authentification (if user uses a proxy with login)
  • 07 Mar 2011: Minor bugfix: if Limit was set to 0 now it takes the max 500 (before it took 0) records.
  • 11 Apr 2011: Add CollectiveName to authorlist. E.g. see PubMed:18391952 and «Diabetes Genetics Initiative» and «Wellcome Trust Case Control Consortium» in authorlist.
  • 25.01.2012: Modification by Spencer Bliven in Date fild extraction.
  • 24.05.2017: Minor bug fixes that come with STRICT mode on Mac port.
  • 18 Jul 2018: changing http:// to https:// for outleading links
  • 31.10.2018: Fixing nested titles of the article — seems Pubmed can list more than one Title with

Version 3 — json interface (experimental)

  • You could test this version next to the other after installing by by changing wgPubmedPath to $wgPubmedPath=»extensions/Pubmed3″;

For German users: Es gibt noch ein Einsprung mit der Issn und Essn zur ZDB — Dazu dieses definieren: layoutfile=»layout_ext2.def» layoutlinks=»PMID,ZDB,EZB_HD,DOI»

Альтернативные интерфейсы

Национальная библиотека Медицины сдает в аренду информацию MEDLINE многим частным продавцам, таким как Ovid, Диалог, EBSCO, Искатель Знаний и многие другие коммерческие, некоммерческие, и академические поставщики., больше чем 500 лицензий были выпущены, больше чем 200 из них поставщикам за пределами Соединенных Штатов. Поскольку лицензии, чтобы использовать данные MEDLINE доступны бесплатно, NLM в действительности обеспечивает свободную испытательную площадку для широкого диапазона альтернативных интерфейсов и сторонних дополнений к PubMed, одному из очень немногих больших, профессионально курировавшие базы данных, который предлагает этот выбор.

Лютеций определяет образец 28 текущих и свободных Сетевых версий PubMed, не требуя никакой установки или регистрации, которые сгруппированы в четыре категории:

  • Ранжирование результатов поиска, например: eTBLAST; Hakia; MedlineRanker; MiSearch;
  • Группируя результаты темами, авторами, журналы и т.д., например: Энн О’Тейт; ClusterMed;
  • Усиление семантики и визуализации, например: EBIMed; MedEvi; (Отметьте: CiteXplore был выведен из эксплуатации 15 февраля 2013, заменен Европой Центральный PubMed.)
  • Улучшенный поисковый интерфейс и поисковый опыт, например, askMEDLINE BabelMeSH; и PubCrawler.
  • GoPubMed — основанное на знаниях (Генная Онтология и MeSH) поисковая система для PubMed. GoPubMed — семантическая поисковая система для наук о жизни.
  • Expertscape обеспечивает поиск и ранжирование медицинских и биомедицинских экспертных знаний определенным диагнозом, техникой или другой терминологией. Результаты основаны на анализе, полученном с новых десяти лет данных PubMed.
  • Экспедиторы критерия поиска как, который запускает поиски на многократных внешних платформах, полученных на основании оригинальных условий логического поиска.
  • Reference-to-PubMed transcriptors как, который восстанавливает PMID из одного письма, закодировал сокращения журнала, чтобы получить полнотекстовые статьи.
  • Свяжите arborizers, который пытается восстановить доступный PDF от дополнительных хозяев.

Поскольку большинство этих и других альтернатив полагается по существу на данные PubMed/MEDLINE, арендованные в соответствии с лицензией у NLM/PubMed, термин «производные PubMed» был предложен.

Без потребности сохранить приблизительно 90 ГБ оригинальных Наборов данных PubMed, кто-либо может написать приложения PubMed, используя интерфейс eutils-приложения, как описано во «Всесторонних электронных утилитах: Параметры, Синтаксис и Больше», Эриком Сэйерсом, доктором философии

Installation[edit]

To install this extension, add the following to LocalSettings.php:

$wgPubmedPath="extensions/Pubmed";

$wgPubmedLayoutFile="layout_ext.def";
$wgPubmedLayoutLinks="PMID,WORLDCAT,DOI";
$wgPubmedCache="/tmp/pubmedcache2";
$wgPubmedProxyHost="";
$wgPubmedProxyPort="";
$wgPubmedProxyUser="";
$wgPubmedProxyPass="";
$wgPubmedDEBUG=;
$wgPubmedLimit=5;
$wgPubmedOffset=;

//$wgPubmedSOAP="auto";       *Deprecated*
//$wgNUSOAPencodinghack=true; *Deprecated*

require_once("$wgPubmedPath/Pubmed.php");

The PHP parameter needs to be set in your servers «php.ini» file for this extension to work. Usually this setting is deactivated because of security considerations.

Таблица запросов клинически важной информации с использованием фильтров исследовательских методов

Категория

Отимизация по

Чувствительность/ Специфичность

Запрос на языке PubMed

Лечение

Чувствительности

99%/74%

«randomized controlled trial» OR «drug therapy» OR «therapeutic use» OR «random*»

Специфичности

57%/97%

(double AND blind* ) OR placebo

Диагностика

Чувствительности

92%/73%

«sensitivity and specificity» OR «sensitivity» OR «diagnosis» OR «diagnostic use» OR «specificity»

Специфичности

55%/98%

«sensitivity and specificity» OR ( «predictive» AND «value*» )

Этиология

Чувствительности

82%/70%

«cohort studies» OR «risk» OR («odds» AND «ratio*» ) OR («relative» AND «risk» ) OR «case» control*» OR case-control studies

Специфичности

40%/98%

«case-control studies» OR «cohort studies»

Прогноз

Чувствительности

92%/73%

«incidence» OR «mortality» OR «follow-up studies» OR «mortality» OR prognos* OR predict* OR course

Специфичности

49%/97%

prognosis OR «survival analysis»

Как же можно использовать эту таблицу? В наиболее общем виде запрос будет выглядеть так

(Описание темы MESH терминами) AND (Фильтр)

Так, если врач хочет найти статьи, посвященные прогнозу ишемической болезни сердца, он вначале выберет соответствующий данному заболеванию MESH термин, например Myocardial Ischemia. Вполне возможно, он захочет использовать несколько MESH терминов: Myocardial Ischemia OR Myocardial Infarction . Затем ему надо будет решить, какой тип поиска он хочет использовать — максимально возможное количество публикаций, но с риском получения большого количества ненужной информации или максимально адекватную выборку с риском потери статей. Предположим, что у врача не так много времени и ему надо создать наиболее компактную выборку. Тогда он берет фильтр, оптимизированный по специфичности и связывает его описанием задачи оператором AND

(Myocardial Ischemia OR Myocardial Infarction )

AND

(prognosis OR «survival analysis» )

Обратите внимание на то, что обе части запроса заключены в скобки. Если их не будет, последовательность выполнения операторов будет нарушена и запрос будет выполнен неверно

Следует отметить, что Web-версия PubMed имеет специальную страницу с клиническими фильтрами, где пользователь может создать запрос не вспоминая структуру фильтра, а только указав, какой тип исследования он хочет найти и надо ему оптимизировать поиск по чувствительности или по специфичности.

Таким образом, фильтры являются мощным инструментом в использовании системы PubMed и они позволяют даже занятому клиницисту быстро и адекватно находить интересующую его информацию

Оцените статью
Понравилась статья?
Комментарии (0)
Комментариев нет, будьте первым кто его оставит
Добавить комментарий
Ваш e-mail не будет опубликован. Обязательные поля помечены *