с каким параметром отражаемых свойств объекта связана репрезентативность информации
Показатели качества информации
Primary tabs
Показатели качества информации
Адекватность информации может выражаться в трех формах: семантической, синтаксической, прагматической.
Качество информации определяется такими показателями, как:
Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта.
Важнейшее значение здесь имеют:
Нарушение репрезентативности информации приводит нередко к существенным ее погрешностям.
Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных.
С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.
Наряду с коэффициентом содержательности С, отражающим семантический аспект, можно использовать и коэффициент информативности, характеризующийся отношением
Достаточность (полнота) информации означает, что она содержит минимальный, но достаточный для принятия правильного решения состав (набор показателей). Понятие полноты информации связано с ее смысловым содержанием (семантикой) и праг-матикой. Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.
Доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования. Например, в информационной системе информация преобразовывается к доступной и удобной для восприятия пользователя форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя.
Актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации.
Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.
Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:
Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.
Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.
В заключение следует отметить, что такие параметры качества информации, как репрезентативность, содержательность, достаточность, доступность, устойчивость, целиком определяются на методическом уровне разработки информационных систем.
Параметры актуальности, своевременности, точности и достоверности обусловливаются в большей степени также на методическом уровне, однако на их величину существенно влияет и характер функционирования системы, в первую очередь ее надежность.
При этом параметры актуальности и точности жестко связаны соответственно с параметрами своевременности и достоверности.
КАЧЕСТВО ИНФОРМАЦИИ
Дата добавления: 2013-12-23 ; просмотров: 5563 ; Нарушение авторских прав
Возможность и эффективность использования информации обусловливаются такими основными ее потребительскими показателями качества, как репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.
Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют:
· правильность концепции, на базе которой сформулировано исходное понятие;
· обоснованность отбора существенных признаков и связей отображаемого явления.
Нарушение репрезентативности информации приводит нередко к существенным ее погрешностям.
С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.
Достаточность (полнота) информации означает, что она содержит минимальный, но достаточный для принятия правильного решения состав (набор показателей). Понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.
Доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования. Например, в информационной системе информация преобразовывается к доступной и удобной для восприятия пользователя форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя.
Актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации.
Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.
Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:
· формальная точность, измеряемая значением единицы младшего разряда числа;
· реальная точность, определяемая значением единицы последнего разряда числа, верность которого гарантируется;
· максимальная точность, которую можно получить в конкретных условиях функционирования системы;
· необходимая точность, определяемая функциональным назначением показателя.
Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пре делах необходимой точности.
Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.
В заключение следует отметить, что такие параметры качества информации, как репрезентативность, содержательность, достаточность, доступность, устойчивость, целиком определяются на методическом уровне разработки информационных систем. Параметры актуальности, своевременности, точности и достоверности обусловливаются в большей степени также на методическом уровне, однако на их величину существенно влияет и характер функционирования системы, в первую очередь ее надежность. При этом параметры актуальности и точности жестко связаны соответственно с параметрами своевременности и достоверности.
Репрезентативность выборочных данных
Репрезентативность — важнейшее свойство данных, используемых для построения аналитических моделей. Независимо от того, в какой предметной области и какими методами производятся выборочные исследования, отсутствие репрезентативности выборки приводит к некорректным результатам. В статье рассказываем подробнее об этом важном свойстве.
Репрезентативность — важнейшее свойство данных, используемых для построения аналитических моделей. Оно отражает способность данных представлять зависимости и закономерности исследуемой предметной области, которые должна обнаружить и научиться воспроизводить построенная модель. Иными словами, репрезентативность показывает, содержат ли анализируемые данные достаточно информации для построения качественной модели, а так же, может ли эта информация быть использована алгоритмом построения модели.
Репрезентативность генеральной совокупности отражает способность совокупности описывать существенные свойства, зависимости и закономерности объектов, процессов и явлений предметной области. Она достигается за счёт правильной организации сбора и консолидации первичных данных.
Репрезентативность выборки описывает способность выборочных данных отражать структурные свойства совокупности, из которой они были извлечены. Т.е. даёт ответ на вопрос: можно ли в исследовании заменить совокупность на выборку без значимого ухудшения результатов анализа. Репрезентативность выборки достигается с помощью правильного выбора метода сэмплинга.
Таким образом, репрезентативность выборки касается только воспроизведения характеристик совокупности. Если сама исходная совокупность плохо представляет предметную область, то, даже если полученная из неё выборка будет репрезентативной, построить на её основе корректную с точки зрения предметной области модель будут невозможно.
Например, пусть компания собирается вывести на рынок новый продукт. При этом она хочет провести маркетинговые исследования в виде опроса клиентов о желаемых характеристиках и параметрах продукта. Число клиентов компании насчитывает сотни тысяч человек (генеральная совокупность), поэтому опросить их всех не представляется возможным физически, не является целесообразным экономически.
Поэтому компания формирует выборку клиентов для проведения опроса. Если мнение клиентов из выборки отражает мнение большинства клиентов и может быть использовано для принятия решений о параметрах и характеристиках нового продукта, то такая выборка будет репрезентативной.
Независимо от того, в какой предметной области и какими методами производятся выборочные исследования, отсутствие репрезентативности выборки приводит к некорректным результатам. Поэтому в процессе анализа необходимо убедиться, что сформированная выборка репрезентативна.
Таким образом, репрезентативная выборка — это такая выборка, в которой представлены все подгруппы, важные для исследования. Помимо этого, характер распределения рассматриваемых параметров в выборке должен быть таким же, как в генеральной совокупности.
Особенно важным является обеспечение репрезентативности в машинном обучении, для построения моделей классификации и регрессии используется несколько выборок: обучающая, тестовая и валидационная, которые тем или иным способом отбираются из исходного набора данных. И все эти выборки должны быть репрезентативными.
Обеспечение репрезентативности
В основе построения репрезентативной выборки лежит правильный выбор используемого алгоритма сэмплинга. При этом размер выборки, хотя и является важным, сам по себе не гарантирует ее репрезентативности. Например, интернет-опрос может показать, что 100% людей пользуется интернетом, хотя это не соответствует действительности (т.е. репрезентативность нарушена).
Выделяют качественную (структурную) и количественную репрезентативность.
Рисунок 1. Количественная и качественная репрезентативность
Качественная репрезентативность
Качественная репрезентативность показывает, что все группы, присутствующие в совокупности, будут представлены и в выборке. Для этого каждый элемент совокупности должен иметь равную вероятность, быть выбранным, а сама выборка должна производиться из однородных групп.
Наиболее оптимальным способом формирования репрезентативной выборки является простой случайный сэмплинг, поскольку в этом случае у любого представителя генеральной совокупности будет одинаковая вероятность попасть в выборку.
Например, при формировании выборки клиентов для опроса, в нее попадут люди из различных социальных групп пропорционально их долям в генеральной совокупности. В результате, выборка будет представлять собой уменьшенную копию генеральной совокупности.
Случайность отбора респондентов в выборку может обеспечивается различными методами. Например, для опроса клиентов берутся номера клиентских карт, которые случайным образом отбираются компьютерной программой с использованием генератора случайных чисел.
Однако, на практике применить простой случайный сэмплинг не всегда представляется возможным. Это связано с тем, что генеральная совокупность может быть неоднородной и будет содержать группы объектов.
Например, если опрос будет проводиться по телефону, то большинство откликов будет получено от пенсионеров, как людей менее занятых и более склонных идти на контакт. Очевидно, что если опрос проводится о продукте, ориентированном на молодёжь, то ценность мнения пенсионеров вряд ли будет высокой.
Чтобы решить эту проблему, можно использовать случайный стратифицированный сэмплинг, когда исходная совокупность сначала разделяется на слои (страты) по некоторому признаку. Например, клиенты могут быть стратифицированы по возрасту. Тогда страты могут быть сформированы пропорционально доле объектов в группах, что позволит уменьшить или увеличить долю той или иной группы, сохранив репрезентативность.
Другой вариант — использовать кластерный (групповой) сэмплинг, когда клиенты предварительно разбиваются на качественно однородные группы — кластеры, и отбор производится из каждого кластера независимо. При этом вероятность отбора может быть одинаковой для всех кластеров, или различной. Можно некоторые кластеры вообще исключить из отбора. В нашем примере клиенты могут быть разбиты на кластеры по социальному статусу — студенты, работающие, пенсионеры, военнослужащие и т.д. Таким образом, долю, пенсионеров в выборке, можно уменьшить или совсем исключить.
Количественная репрезентативность
Количественная репрезентативность показывает, является ли достаточным число элементов выборки для представления характеристик генеральной совокупности с заданной погрешностью. Например, при неизвестной величине генеральной совокупности, когда результат отражается в виде показателя относительной доли, число элементов выборки, обеспечивающее количественную репрезентативность, может быть вычислено по формуле:
где t — доверительный коэффициент, показывающий, какова вероятность того, что размеры показателя не будут выходить за границы предельной ошибки, p — доля единиц наблюдения, обладающих изучаемым признаком, q=1−p — доля единиц наблюдения, не обладающих изучаемым признаков, Δ — допустимая ошибка выборки.
n=\frac<2^<2>\cdot 0,25\cdot 0,75><0,05^<2>>=300 заёмщиков.
Если же показатель — не относительная средняя величина просроченной задолженности по всем клиентам, то число наблюдений будет:
Если используется выборка без возврата и размер генеральной совокупности известен, то для определения необходимого размера случайной выборки при использования относительных величин (долей) применяется формула:
n=\frac
где N — число наблюдений генеральной совокупности. Для средних значений исследуемой величины формула примет вид:
n=\frac<2^<2>\cdot 0,25\cdot 0,75\cdot 500><0,05^<2>\cdot 500+2^<2>\cdot 0,25\cdot 0,75>\approx 188 клиентов.
Таким образом, необходимый объем выборки при безвозвратном отборе меньше, чем при возвратном (соответственнo, 188 и 300).
В целом, число наблюдений, требуемое для получения репрезентативной выборки, изменяется обратно пропорционально квадрату допустимой ошибки.
Методы оценки репрезентативности
Формально, выборку называют репрезентативной, когда результат оценки определенного параметра по данной выборке совпадает с результатом, оцененным по генеральной совокупности с учетом допустимой погрешности (ошибки репрезентативности). Если выборочная оценка отличается от оценки по генеральной совокупности более, чем на заданный уровень погрешности, то такая выборка считается нерепрезентативной.
Репрезентативность оценивается по отдельным параметрам выборки и совокупности. При этом выборка может оказаться репрезентативной по одним параметрам и нерепрезентативной по другим. Поэтому говорить о репрезентативности как о дихотомическом свойстве выборки (репрезентативна или нерепрезентативна) было бы не верно: выборка может одни параметры генеральной совокупности воспроизводить более точно, а другие — менее. Поэтому правильнее говорить о мере репрезентативности определённой выборки по конкретным параметрам.
Основным моментом в определении репрезентативности выборки является обоснование погрешности, в пределах которой выборка признается репрезентативной. Одна и та же выборка может быть достаточно репрезентативной для одной задачи и недостаточно для другой. Кроме этого, нужно проверять репрезентативность выборки по параметрам, имеющим существенное значение для предметной области исследования. Например, в маркетинговых исследованиях для анализа клиентов важны пол, возрасту, образование и пр.
Следует отметить, что далеко не все задачи бизнес-аналитики требуют строгого статистического подтверждения репрезентативности выборок. Как правило, это задачи точного прогнозирования. Что касается обычных задач, связанных, например, с определением предпочтений действующих и потенциальных клиентов, то они решаются охватом типичной клиентуры, которую можно найти непосредственно в торговых центрах.
Статистические методы
Данные, полученные в результате выборочных обследований, являются реализациями случайных величин (возраст, стаж работы, доход и т.д.). Обычно, на практике считают, что выборка является репрезентативной, если её статистические параметры (среднее значение, дисперсия, среднеквадратичное отклонение и т.д.) отличаются от параметров совокупности не более, чем на 5%.
Однако, данный подход применим только при условии, что вся генеральная совокупность известна и для неё можно вычислить статистические характеристики. Но на практике такое встречается редко, поскольку часть потенциально интересных для исследования объектов оказывается недоступной для наблюдения.
В этом случае прибегают к формированию двух независимых выборок, вычисляют и сравнивают их характеристики, и если они совпадают (не различаются значимо), то выборки считаются репрезентативными. В теоретическом плане такой подход является достаточно привлекательным, однако, на практике сложно реализуем. Во-первых, формирование нескольких выборок ведёт к дополнительным затратам, а во-вторых, если параметры выборок значимо различаются, то невозможно сказать, какая из них репрезентативна.
Нестатистические методы
Статистические методы оценки репрезентативности выборочных данных, хотя и являются строго обоснованными, но довольно сложны в использовании (особенно для пользователей, не имеющих достаточной математической подготовки). Кроме этого они могут иметь ограничения (например, независимость выборок), удовлетворить которым достаточно сложно.
Статистические подходы к оценке репрезентативности выборок имеет смысл использовать, если для анализа данных используются статистические методы. Методы машинного обучения, которые является эвристическими и в большинстве случаев не обеспечивают точного и единственного решения, вообще говоря, не нуждаются в точной оценке репрезентативности обучающих выборок. Поэтому в них используются свои техники для определения того, насколько обучающая или тестовая выборка хорошо представляют исходную совокупность.
Ещё одной особенностью выборок, используемых в машинном обучении, является то, что объём исходной совокупности, из которой формируются обучающее, тестовое, а при необходимости, и валидационное множество, известен, поскольку данные содержатся в консолидированных таблицах источника данных.
Затем вычислим величину:
где D_<_
Тогда индекс ближайшего соседа будет:
Если значение данного показателя близко к 1, то точки выборки имеют равномерное пространственное распределение. Если меньше 1, то пространственное распределение точек неоднородно. Если NNI больше 1, то имеет место значительная дисперсия значений внутри выборки.
Очевидно, что наилучшим вариантом с точки зрения репрезентативности будет первый случай, когда пространственное распределение точек данных в совокупности и выборке примерно одинаковое. Второй случай показывает, что внутри выборки могут присутствовать некоторое локальные особенности, нехарактерные для всей совокупности.
В литературе можно найти больше количество разнообразных алгоритмов и методов оценки репрезентативности выборок для машинного обучения, разработанных для различных предметных областей исследования и типов задач анализа. Большинство их них являются эвристическими и не гарантируют получения наилучшего результата. Поэтому самым надёжным критерием репрезентативности выборки, на основе которой строилась определённая обучаемая модель, является точность и обобщающая способность самой модели.
Ремонт выборки
Возникает вопрос: а что делать в ситуации, когда аналитику доступна только выборка «как есть», а её репрезентативность неудовлетворительная? При этом доступ к генеральной совокупности для формирования более репрезентативной выборки у него отсутствует (например, из-за проблем с сетью, невозможности повторных исследований из-за высоких затрат и т.д.). В этом случае улучшить ситуацию может специальная процедура, которая называется «ремонт выборки».
Все действия аналитика, связанные с репрезентативностью, можно разделить на два этапа: контроль и ремонт.
Контроль и ремонт выборки рассматриваются как обязательные этапы любого выборочного исследования. Хотя, некоторые авторы не разделяют эти два этапа, а включают ремонт в общую процедуру контроля выборки. Ряд вопросов, связанных с контролем выборки был рассмотрен выше.
Основной целью ремонта является повышение качества выборки в смысле отражения ею зависимостей и закономерностей исследуемых процессов и явлений, которые требуется обнаружить в процессе анализа. При этом не следует путать ремонт выборки с повышением качества данных вообще.
Ремонт выборки, обычно, включает следующие задачи:
Следует отметить, что единого, строго обоснованного подхода к ремонту выборок, вообще говоря, не существует, хотя в литературе можно встретить некоторые общие рекомендации. В большинстве практических случаев аналитику приходится самостоятельно выбирать, какие преобразования следует применить к выборке для повышения её репрезентативности.
Показатели качества информации
Информация в системе управления является и предметом труда и продуктом труда, поэтому от ее качества существенно зависят эффективность и качество функционирования системы. Качество информации можно определить как совокупность свойств, обусловливающих возможность ее использования для удовлетворения определенных в соответствии с ее назначением потребностей. Возможность и эффективность использования информации для управления обусловливается такими ее потребительскими показателями качества, как репрезентативность, содержательность, достаточность, доступность, своевременность, устойчивость, точность, достоверность, актуальность, защищенность и ценность.
Репрезентативность
Репрезентативность — правильность, качественная адекватность отражения заданных свойств объекта. Репрезентативность информации зависит от правильности ее отбора и формирования. Важнейшее значение при этом приобретают: верность концепции, на базе которой сформулировано исходное понятие, отображаемое показателем; обоснованность отбора существенных признаков и связей отображаемого явления; правильность методики измерения и алгоритма формирования экономического показателя. Нарушение репрезентативности информации приводит нередко к существенным ее погрешностям, называемым чаще всего алгоритмическими.
Содержательность
Содержательность информации — это ее удельная семантическая емкость, равная отношению количества семантической информации в сообщении к объему данных, его отображающих, то есть S = Iс/Vд.
С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для передачи одних и тех же сведений требуется преобразовывать меньший объем данных.
Достаточность
Достаточность (полнота) экономической информации означает, что она содержит минимальный, но достаточный для принятия правильного управленческого решения набор экономических показателей. Понятие достаточности информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, то есть недостаточная для принятия правильного решения, так и избыточная информация снижают эффективность управления; наивысшим качеством обладает именно полная информация.
Доступность
Доступность информации для восприятия при принятии управленческого решения обеспечивается выполнением соответствующих процедур ее получения и преобразования. Так, назначением вычислительной системы и является увеличение доступности информации путем согласования ее с тезаурусом пользователя, то есть преобразование ее к доступной и удобной для восприятия пользователем форме.
Актуальность
Актуальность информации — это свойство информации сохранять свою полезность (ценность) для управления во времени. Измеряется актуальность А(t) степенью сохранения начальной полезности информации Z(t0) в момент времени t ее использования:
где Z(t)— полезность информации в момент времени t.
Актуальность зависит от статистических характеристик отображаемого объекта (от динамики изменения этих характеристик) и от интервала времени, прошедшего с момента возникновения данной информации.
Своевременность
Своевременность — это свойство информации, обеспечивающее возможность ее использования в заданный момент времени. Несвоевременная информация приводит к экономическим потерям и в сфере управления, и в сфере производства. Причиной, обусловливающей экономические потери от несвоевременности в сфере управления, является нарушение установленного режима решения функциональных задач, а иногда и их алгоритмов. Это приводит к увеличению стоимости решения задач вследствие снижения ритмичности, увеличения простоев и сверхурочных работ и т.п. в сфере материального производства. Потери от несвоевременности информации связаны со снижением качества управленческих решений, принятием решения на базе неполной информации или информации некачественной. Своевременной является такая информация, которая может быть учтена при выработке управленческого решения без нарушения регламента, поступающая в систему управления не позже назначенного момента времени.
Точность
Точность информации — это степень близости отображаемого информацией значения и истинного значения данного параметра. Например, для экономических показателей, отображаемых цифровым кодом, известны четыре классификационных понятия точности:
· формальная точность, измеряемая значением единицы младшего разряда числа, которым показатель представлен;
· реальная точность, определяемая значением единицы последнего разряда числа, верность которого гарантируется;
· достижимая точность — максимальная точность, которую можно получить в данных конкретных условиях функционирования системы;
· необходимая точность, определяемая функциональным назначением показателя и обеспечивающая правильность принимаемого управленческого решения.
Достоверность
Достоверность информации — свойство информации отражать реально существующие объекты с необходимой точностью. Достоверность информации измеряется доверительной вероятностью необходимой точности, то есть вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности. Наряду с понятием «достоверность информации», существует понятие «достоверность данных», то есть информации, рассматриваемой в синтаксическом аспекте. Под достоверностью данных понимается их безошибочность; измеряемая вероятностью появления ошибок в данных. Недостоверность данных может не повлиять на объем данных, а может даже и увеличить его, в отличие от недостоверности информации, всегда уменьшающей ее количество.
Устойчивость
Устойчивость информации — свойство результатной информации реагировать на изменения исходных данных, сохраняя необходимую точность. Устойчивость информации, как и ее репрезентативность, обусловлена в первую очередь методической правильностью ее отбора и формирования.
Защищенность
Защищенность информации – свойство информации противостоять несанкционированному доступу и ее преднамеренному искажению. Защищенность информации обеспечивается ее криптографическим закрытием и, в частности, цифровой подписью.
Полезность
Полезность информации — комплексный показатель ее качества, ее мера на прагматическом уровне. Полезность информации определяется эффективностью осуществляемого на ее основе управления.
Такие показатели качества информации, как репрезентативность, содержательность, достаточность,доступность, устойчивость, целиком предопределяются на методическом уровне разработки системы управления. Показатели актуальности, своевременности, точности, достоверности и защищенности обусловливаются в большей степени также на методическом уровне, однако, на их величину существенно влияет и характер функционирования системы, в первую очередь, ее надежность и достоверность. При этом показатели актуальности и точности жестко связаны с показателями, соответственно, своевременности и достоверности: существенное нарушение первых, приводящее к снижению эффективности функционирования системы, неизбежно вызывает нарушение вторых.
Исследования показывают, что для целевой функции оптимизации функционирования методически правильно спроектированной информационной системы в качестве ограничений, обусловливаемых показателями качества информации, достаточно использовать ограничения только по достаточности, защищенности, своевременности и достоверности.
Информатика
Объект, подробно рассмотренный нами выше, изучает наука «Информатика», следует различать информатику как науку, информатику как информационные технологии и информатику как отрасль промышленности.
Наука информатика
Информатика — это наука, изучающая свойства, структуру и функции информационных систем, основы их проектирования, создания, использования и оценки, а также происходящие информационные процессы. Под информационной системой понимают систему, организующую, хранящую и преобразующую информацию, то есть систему, основным предметом и продуктом труда в которой является информация. Подавляющее большинство современных сложных информационных систем — автоматизированные, в частности, компьютеризированные; по своей природе они эргатехнические, в их функционировании принимают непосредственное участие и люди (эргатические элементы), и технические средства.
Информатика тесно связана с кибернетикой, но не заменяет ее, а имеет свою область исследования. Кибернетика изучает общие закономерности процессов управления в системах любой природы, абстрагируясь от конкретного вида и их специфики. Информатика же изучает общие свойства только информационных систем и процессов с предварительной их дифференциацией (управленческие, медицинские, обучающие, информационно-поисковые и т. д.).
Появление информатики вызвано осмыслением содержания и значения информации в системах управления, переходом:
l от автоматизации простых (рутинных) операций умственного труда к комплексной автоматизации элементов творческого процесса;
l от компьютерных систем, обрабатывающих информацию на синтаксическом уровне, так называемых систем обработки данных (СОД), к системам обработки знаний (СОЗ), осуществляющим логические выводы, осмысливающим преобразуемую информацию;
l от баз данных — хранилищ информационных фактов, связанных структурно между собой заранее, к базам знаний, устанавливающих логические связи между фактами, применительно к конкретным целям и областям их использования.
Можно выделить такие основные направления исследований науки информатика, как:
§ теория алгоритмов и инженерия программного управления (разработка моделей алгоритмов, снижение сложности вычислительных процессов, оптимизация языков программирования, технологий создания и исполнения программ);
§ теория вычислительных систем (совершенствование архитектуры и организации компьютеров и информационно-вычислительных систем разных классов);
§ теория систем искусственного интеллекта (представление знаний, обработка знаний, базы знаний, экспертные системы, построение систем компьютерного обучения, в том числе и дистанционного);
§ организация эффективных баз данных/знаний и систем управления базами данных/знаний;
§ теория нейронных систем (нейрокомпьютеров, использования нейронных сетей для обучения);
§ бионика (использование биотехнологий для оптимизации информационно-вычислительных систем);
§ распознавание образов и компьютерная обработка видеоинформации;
§ теория построения и управления роботами, планирование их целесообразного поведения;
§ теория построения саморазвивающихся и самооптимизирующихся компьютерных систем; построения систем искусственного интеллекта;
§ оптимизация «коллективного поведения» компьютеров в сложных системах;
§ совершенствование информационных технологий поддержки принятия управленческих решений;
§ оптимизация мультимедийных компьютерных систем и систем виртуальной реальности;
§ построение эффективных интерфейсов «человек — машина», в том числе систем речевого ввода информации.
Информационные технологии
Информационная технология — система процедур преобразования информации с целью формирования, организации, обработки, распространения и использования информации. Основу современных информационных технологий составляют:
l компьютерная обработка информации по заданным алгоритмам;
l хранение больших объемов информации на машинных носителях;
l передача информации на любое расстояние в ограниченное время.
Можно указать следующие основные отличительные черты современной информационной технологии:
1. Дружественный интерфейс пользователя (разветвленная система меню функций обработки данных и подсказок).
2. Интерактивный (диалоговый) режим решения задач с широкими возможностями для пользователя оперативно влиять на ход решения.
3. Сквозная информационная поддержка всех этапов преобразования информации с помощью интегрированной базы данных, унифицированных форм представления информации.
4. Возможность коллективного решения задач на основе информационных сетей и систем телекоммуникаций, обеспечивающих всем пользователям оперативный доступ к любым техническим, программным и информационным ресурсам системы.
5. Безбумажная технология, при которой основным носителем информации является не бумажный, а электронный документ, формируемый на машинном носителе (в памяти компьютера) и доводимый до пользователя через экран дисплея.
Технологический процесс преобразования информации в общем случае включает в себя такие процедуры (стадии), как получение, сбор и регистрация информации, передача, хранение, обработка, выдача обработанной (результатной) информации, принятие решения для выработки управляющих воздействий.
На всех стадиях технологического процесса, кроме первой и последней, преобразование информации осуществляется по существу лишь на синтаксическом уровне. Даже на стадии обработки, когда выполняются совокупности арифметических и логических операций над информацией, с формальной точки зрения выполняются операции над данными. Хотя состав и последовательность этих операций (алгоритм преобразования) обусловлены семантическими или прагматическими свойствами информации, после разработки алгоритма реализации от смыслового содержания информации можно абстрагироваться.
Таким образом, информация, полученная после анализа состояния объекта управления и внешней (по отношению к системе управления) среды и зафиксированная на носителе для дальнейшего преобразования, становится данными, а результирующие данные в момент их использования (при выработке решения) снова становятся информацией. Поэтому технологический процесс преобразования информации без первой и последней стадий, названных выше, обычно называют технологическим процессом обработки данных, а систему, реализующую указанный процесс, системой обработки данных.
Индустрия информатики
Информатика как отрасль промышленности включает в себя все основные и обеспечивающие предприятия и организации по обработке данных и производству алгоритмов, программ и средств вычислительной техники. Индустрия информатики — это инфраструктурная отрасль народного хозяйства, обслуживающая другие отрасли материального производства и непроизводственной сферы, обеспечивая их необходимыми информационными ресурсами, создающая условия для их эффективного функционирования и развития (своеобразная «нервная система» общественного производства). К основным элементам производственной структуры данной отрасли можно отнести:
l предприятия, производящие вычислительную технику и ее элементы;
l центры обработки данных и вычислительные центры различного типа и назначения (индивидуальные, кустовые, коллективного пользования и т. д.);
l локальные и подключенные к распределенным вычислительным сетям пункты обработки информации, оснащенные компьютерами (в том числе и АРМ специалистов);
l абонентские пункты систем телеобработки данных и вычислительных сетей;
l системы связи и передачи данных в составе вычислительных сетей;
l предприятия, осуществляющие производство программных средств и проектирование информационных систем (в частности, баз данных);
l организации, накапливающие, распространяющие и обслуживающие фонды алгоритмов и программ;
l станции технического обслуживания вычислительной техники.
Вопросы для самопроверки
1. Дайте развернутую характеристику понятию «информация».
2. Назовите основные особенности и структурные компоненты экономической информации.
3. Поясните синтаксическую, семантическую и прагматическую формы адекватности информации.
4. Назовите и поясните способы измерения данных и информации.
5. В чем различие понятий «количество информации» и «объем данных»?
6. Перечислите показатели качества информации и дайте их краткое пояснение.
7. Что такое «Кибернетика»? Обрисуйте круг проблем этой науки.
8. Сформулируйте сущность информатики как науки, технологии и индустрии.
Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право.
ЧТО ТАКОЕ УВЕРЕННОЕ ПОВЕДЕНИЕ В МЕЖЛИЧНОСТНЫХ ОТНОШЕНИЯХ? Исторически существует три основных модели различий, существующих между.
ЧТО И КАК ПИСАЛИ О МОДЕ В ЖУРНАЛАХ НАЧАЛА XX ВЕКА Первый номер журнала «Аполлон» за 1909 г. начинался, по сути, с программного заявления редакции журнала.
Что делать, если нет взаимности? А теперь спустимся с небес на землю. Приземлились? Продолжаем разговор.
Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте: