ВВЕДЕНИЕ В ЯЗЫК СИСОДЕРЖАНИЕВВЕДЕНИЕРАЗДЕЛ 1. ОСНОВНЫЕ ПОНЯТИЯ И ДАННЫЕРАЗДЕЛ 2. ОПЕРАЦИИ И ОПЕРАТОРЫРАЗДЕЛ 3. СТРУКТУРИРОВАННЫЕ ТИПЫ ДАННЫХРАЗДЕЛ 4. ФУНКЦИИРАЗДЕЛ 5. ФАЙЛЫРАЗДЕЛ 6. ДРУГИЕ ВОЗМОЖНОСТИРАЗДЕЛ 7. ПРИМЕРЫЛИТЕРАТУРА
ВВЕДЕНИЕЯзык Си, созданный Денисом Ритчи в начале 70-х годов в Bell Laboratory американской корпорации AT&T, является одним из универсальных языков программирования. Язык Си считается языком системного программирования, хотя он удобен и для написания прикладных программ. Среди преимуществ языка Си следует отметить переносимость программ на компьютеры различной архитектуры и из одной операционной системы в другую, лаконичность записи алгоритмов, логическую стройность программ, а также возможность получить программный код, сравнимый по скорости выполнения с программами, написанными на языке ассемблера. Последнее связано с тем, что хотя Си является языком высокого уровня, имеющим полный набор конструкций структурного программирования, он также обладает набором низкоуровневых средств, обеспечивающих доступ к аппаратным средствам компьютера. С 1989 года язык Си регламентируется стандартом Американского института национальных стандартов ANSI С. В настоящее время, кроме стандарта ANSI C разработан международный стандарт ISO C (International Standard Organization C). В пособии в разделах 1-6 рассматриваются основные конструкции языка Си (общие для Си и Си++). Примеры программ приведены в разделе 7.
РАЗДЕЛ 1. ОСНОВНЫЕ ПОНЯТИЯ И ДАННЫЕОсновные понятия языкаПрограмма, написанная на языке Си, состоит из операторов. Каждый оператор вызывает выполнение некоторых действий на соответствующем шаге выполнения программы. При написании операторов применяются латинские прописные и строчные буквы, цифры и специальные знаки. К таким знакам, например, относятся: точка (.), запятая (,), двоеточие (:), точка с запятой (;) и др. Совокупность символов, используемых в языке, называется алфавитом языка. В персональном компьютере символы хранятся в виде кодов. Соответствие между каждым символом и его кодом задается специальной кодовой таблицей. На нее разработан стандарт ASCII, поэтому коды символов называют ASCII-кодами. Различают видимые и управляющие символы. Первые могут быть отображены на экране дисплея либо отпечатаны на принтере. Вторые вызывают определенные действия в машине, например: звуковой сигнал - код 710, возврат курсора на один шаг - код 810, горизонтальная табуляция - код 910, перевод курсора на новую строку - код 1010, перемещение курсора в начало строки - код 1310 и т.д. Такие управляющие символы имеют десятичные номера 0 - 31, 127. Для представления каждого символа в персональном компьютере используется один байт, поэтому общее число символов равно 28 = 256. Кодовая таблица, которая устанавливает соответствие между символом и его кодом, имеет 256 строк вида: код_символа_в_заданной_системе_счисления - символ. Первая половина кодовой таблицы является стандартной, а вторая используется для представления символов национальных алфавитов, псевдографических элементов и т.д. Важным понятием языка является идентификатор, который используется в качестве имени объекта (функции, переменной, константы и др.). Идентификаторы должны выбираться с учетом следующих правил:
В программах на языке Си важная роль отводится комментариям. Они повышают наглядность и удобство чтения программ. Комментарии обрамляются символами /* и */. Их можно записывать в любом месте программы. В языке Си++ введена еще одна форма записи комментариев. Все, что находится после знака // до конца текущей строки, будет также рассматриваться как комментарий. Отметим, что компилятор языка Си, встроенный в систему программирования Borland C++, позволяет использовать данный комментарий и в программах на Си. Пробелы, символы табуляции и перехода на новую строку в программах на Си игнорируются. Это позволяет записывать различные выражения в хорошо читаемом виде. Кроме того, строки программы можно начинать с любой позиции, что дает возможность выделять в тексте группы операторов.
Типы данныхПрограммы оперируют с различными данными, которые могут быть простыми и структурированными. Простые данные - это целые и вещественные числа, символы и указатели (адреса объектов в памяти). Целые числа не имеют, а вещественные имеют дробную часть. Структурированные данные - это массивы и структуры; они будут рассмотрены ниже. В языке различают понятия "тип данных" и "модификатор типа". Тип данных - это, например, целый, а модификатор - со знаком или без знака. Целое со знаком будет иметь как положительные, так и отрицательные значения, а целое без знака - только положительные значения. В языке Си можно выделить пять базовых типов, которые задаются следующими ключевыми словами:
Дадим им краткую характеристику:
Объект некоторого базового типа может быть модифицирован. С этой целью используются специальные ключевые слова, называемые модификаторами. В стандарте ANSI языка Си имеются следующие модификаторы типа:
Модификаторы записываются перед спецификаторами типа, например:
unsigned char. Если после модификатора опущен спецификатор, то компилятор
предполагает, что этим спецификатором является int. Таким образом,
следующие строки:
являются идентичными и определяют объект а как длинный целый. Табл. 1 иллюстрирует возможные сочетания модификаторов (unsigned, signed, short, long) со спецификаторами (char, int, float и double), а также показывает размер и диапазон значений объекта (для 16-разрядных компиляторов). Таблица 1
Переменные и константыВсе переменные до их использования должны быть определены (объявлены).
При этом задается тип, а затем идет список из одной или более
переменных этого типа, разделенных запятыми. Например:
В языке различают понятия объявления переменной и ее определения. Объявление устанавливает свойства объекта: его тип (например, целый), размер (например, 4 байта) и т.д. Определение наряду с этим вызывает выделение памяти (в приведенном примере дано определение переменных). Переменные можно разделять по строкам произвольным образом, например:
Переменные в языке Си могут быть инициализированы при их определении:
Выясним теперь, где в тексте программы определяются данные. В языке
возможны глобальные и локальные объекты. Первые определяются вне функций
и, следовательно, доступны для любой из них. Локальные объекты по
отношению к функциям являются внутренними. Они начинают существовать,
при входе в функцию и уничтожаются после выхода из нее. Ниже
показана структура программы на Си и возможные места в программе, где
определяются глобальные и локальные объекты.
Отметим, что выполнение программы всегда начинается с вызова функции main( ), которая содержит тело программы. Тело программы, как и тело любой другой функции, помещается между открывающей и закрывающей фигурными скобками. В языке Си все определения должны следовать перед операторами, составляющими тело функции. В языке Си++ это ограничение снято и определения могут находиться в любом месте программы. Если они сделаны в функции, то соответствующие объекты будут локальными, а если вне функций, то глобальными. Наряду с переменными в языке существуют следующие виды констант:
Как вводить и выводить информациюОперации ввода/вывода в языке Си организованы посредством библиотечных функций (причем их довольно много). Самый простой механизм ввода - чтение по одному символу из стандартного
входного потока (с клавиатуры) с помощью функции getchar( ). Она
имеет следующий прототип (т.е. описание заголовка):
Здесь определен тип единственного аргумента (void) и тип возвращаемого функцией значения (int). Оператор вида:
присваивает переменной х очередной вводимый символ. Переменная х должна иметь символьный или целый тип. Другая функция - putchar(х) выдает значение переменной x в стандартный
выходной поток (на экран дисплея). Функция putchar( ) имеет прототип:
Объявления getchar( ) и putchar( ) сделаны в заголовочном файле
stdio.h, содержащем описания заголовков библиотечных функций стандартного
ввода/вывода. Чтобы библиотечные функции стали доступны программе, к ней
необходимо подключить данный файл. Подключение осуществляется с помощью
директивы препроцессора
помещаемой в начало программы (подробнее см. в разделе 5). Заметим, что для функции getchar( ) после выбора символа необходимо
нажать клавишу <Enter>. Иногда это создает определенные неудобства.
Функции getch( ) и getche( ) устраняют их. Они имеют следующие прототипы:
Обе эти функции вводят символ сразу же после нажатия соответствующей
клавиши (здесь не надо дополнительно нажимать клавишу <Enter>). Отличие
между ними заключается в том, что getche( ) отображает вводимый символ на
экране дисплея, а getch( ) - нет. Прототипы этих функций содержатся в файле
conio.h (консольный ввод/вывод). Для их использования файл conio.h также
следует подключить к программе с помощью директивы #include Функция printf( ) (прототип содержится в файле stdio.h) обеспечивает
форматированный вывод. Ее можно записать в следующем формальном виде:
Управляющая строка содержит компоненты трех типов: обычные символы,
которые просто копируются в стандартный выходной поток (выводятся на экран дисплея);
спецификации преобразования, каждая из которых вызывает вывод на экран
очередного аргумента из последующего списка; управляющие символьные константы.
Каждая спецификация преобразования начинается со знака %
и заканчивается некоторым символом, задающим преобразование. Между знаком % и
символом преобразования могут встречаться другие знаки в соответствии со
следующим форматом:
Все параметры в квадратных скобках не являются обязательными.
На месте параметра c_n (символ преобразования) могут быть записаны: Необязательные параметры в спецификации преобразования: Если после знака % записан не символ преобразования, то он выводится
на экран. Таким образом, строка %% приводит к выводу на экран знака %.
Функция printf( ) использует управляющую строку, чтобы определить,
сколько всего аргументов и каковы их типы. Аргументами могут быть
переменные, константы, выражения, вызовы функций; главное, чтобы их
значения соответствовали заданной спецификации.
При наличии ошибок, например, в числе аргументов или типе преобразования,
результаты будут неверными.
Среди управляющих символьных констант наиболее часто используются
следующие: Например, в результате вызова функции:
сначала выполняется горизонтальная табуляция (\t), т.е. курсор сместится
от края экрана, затем на экран будет выведено слово Computer, после
этого курсор переместится в начало следующей строки (\n), затем будет
выведено целое число i по формату %d (десятичное целое), и, окончательно,
курсор перейдет в начало новой строки (\n).
Напечатать строку символов можно и так:
Функция scanf( ) (прототип содержится в файле stdio.h) обеспечивает
форматированный ввод. Ее можно записать в следующем формальном виде:
Аргументы scanf( ) должны быть указателями на соответствующие значения.
Для этого перед именем переменной записывается символ &. Назначение
указателей будет рассмотрено далее.
Управляющая строка содержит спецификации преобразования и используется
для установления количества и типов аргументов. В нее могут
включаться: Рассмотрим символы преобразования функции scanf( ) (указываются
после символа %): Перед некоторыми символами преобразования могут записываться следующие
модификаторы: Ввести целое число (int a;), символ (char b;) и вещественное число
(float t;) можно так:
Любое выражение языка состоит из операндов (переменных, констант и
др.), соединенных знаками операций. Знак операции - это символ или группа
символов, которые сообщают компилятору о необходимости выполнения
определенных арифметических, логических или других действий.
Операции выполняются в строгой последовательности. Величина,
определяющая преимущественное право на выполнение той или иной операции,
называется приоритетом. В табл. 2 перечислены различные операции языка
Си. Их приоритеты для каждой группы одинаковы (группы выделены цветом).
Чем большим преимуществом пользуется соответствующая группа операций, тем выше
она расположена в таблице. Порядок выполнения операций может регулироваться
с помощью круглых скобок.
Таблица 2
Для исключения путаницы в понятиях "операция" и "оператор", отметим,
что оператор - это наименьшая исполняемая единица программы. Различают
операторы выражения, действие которых состоит в вычислении заданных выражений
(например: a = sin(b)+c; j++;), операторы объявления, составные операторы,
пустые операторы, операторы метки, цикла и т.д. Для обозначения
конца оператора в языке Си используется точка с запятой. Что касается
составного оператора (или блока), представляющего собой набор логически
связанных операторов, помещенных между открывающей ({) и закрывающей
(}) фигурными скобками ("операторными скобками"), то за ним точка с
запятой не ставится. Отметим, что блок отличается от составного оператора
наличием определений в теле блока.
Охарактеризуем основные операции языка Си. Сначала рассмотрим одну
из них - операцию присваивания (=). Выражение вида
присваивает переменной х значение переменной у. Операцию "=" разрешается
использовать многократно в одном выражении, например:
Различают унарные и бинарные операции. У первых из них
один операнд, а у вторых - два. Начнем их рассмотрение с операций, отнесенных
к первой из следующих традиционных групп:
Арифметические операции задаются следующими символами (табл. 2):
+, -, *, /, %. Последнюю из них нельзя применять к переменным
вещественного типа. Например:
Логические операции отношения задаются следующими символами (см.
табл. 2): && ("И"), || ("ИЛИ"), ! ("НЕ"), >, >=, <, <= , = = (равно), !=
(не равно). Традиционно эти операции должны давать одно из двух значений:
истину или ложь. В языке Си принято следующее правило: истина - это любое
ненулевое значение; ложь - это нулевое значение. Выражения, использующие
логические операции и операции отношения, возвращают 0 для ложного
значения и 1 для истинного. Ниже приводится таблица истинности для логических
операций.
Таблица 3
Битовые операции можно применять к переменным, имеющим типы int,
char, а также их вариантам (например, long int). Их нельзя применять к
переменным типов float, double, void (или более сложных типов). Эти
операции задаются следующими символами: ~ (поразрядное отрицание), <<
(сдвиг влево), >> (сдвиг вправо), & (поразрядное "И"), ^ (поразрядное
исключающее "ИЛИ"), | (поразрядное "ИЛИ").
Примеры: если a = 0000 1111 и b = 1000 1000, то
В языке предусмотрены две нетрадиционные операции инкремента (++) и
декремента (--). Они предназначены для увеличения и уменьшения на
единицу значения операнда. Операции ++ и -- можно записывать как перед
операндом, так и после него. В первом случае (++n или --n) значение
операнда (n) изменяется перед его использованием в соответствующем
выражении, а во втором (n++ или n--) - после его использования. Рассмотрим
две следующие строки программы:
Предположим, что b = b1 = 2, c = c1 = 4. Тогда после выполнения
операций: a = 6, b = 2, c = 5, a1 = 7, b1 = 2, c1 = 5.
Широкое распространение находят также выражения с еще одной
нетрадиционной тернарной или условной операцией ?:. В формуле
y = a, если x не равно нулю (т.е. истинно), и y = b, если х равно нулю
(ложно). Следующее выражение
позволяет присвоить переменной у значение большей переменной (а или b),
т.е. y = max(a, b).
Еще одним отличием языка является то, что выражение вида а = а + 5;
можно записать в другой форме: a += 5;. Вместо знака + можно использовать
и символы других бинарных операций (см. табл. 2).
Другие операции из табл. 2 будут описаны в последующих параграфах.
Если в выражении появляются операнды различных типов, то они
преобразуются к некоторому общему типу, при этом к каждому арифметическому
операнду применяется такая последовательность правил:
Предположим, что вычислено значение некоторого выражения в правой
части оператора присваивания. В левой части оператора присваивания
записана некоторая переменная, причем ее тип отличается от типа
результата в правой части. Здесь правила преобразования очень простые:
значение справа от оператора присваивания преобразуется к типу переменной
слева от оператора присваивания. Если размер результата в правой
части больше размера операнда в левой части, то старшая часть этого
результата будет потеряна.
В языке Си можно явно указать тип любого выражения. Для этого
используется операция преобразования ("приведения") типа. Она применяется
следующим образом:
(здесь можно указать любой допустимый в языке Си тип).
Рассмотрим пример:
(переменная a целого типа явно преобразована к типу float; если этого
не сделать, то результат будет потерян, т.к. a * 12 > 32767).
Преобразование типа также может использоваться для преобразования
типов аргументов при вызове функций.
Указатели - это переменные, показывающие место или адрес
памяти, где расположены другие объекты (переменные, функции и др.). Так как
указатель содержит адрес некоторого объекта, то через него можно обращаться
к этому объекту.
Унарная операция & дает адрес объекта,
поэтому оператор
присваивает адрес переменной х переменной
у. Операцию & нельзя применять
к константам и выражениям; конструкции вида &(х+7) или
&28 недопустимы.
Унарная операция * воспринимает свой операнд
как адрес некоторого объекта и использует этот адрес для выборки содержимого,
поэтому оператор
присваивает z значение переменной, записанной
по адресу у. Если
то z = x.
Объекты, состоящие из знака * и адреса (например, *а),
необходимо определить. Делается это, например, так:
Определение вида char *d говорит о том, что
значение, записанное по адресу d, имеет тип char.
Указатели могут встречаться и в выражениях. Если
у - указатель на целое, т.е. имело место объявление
int *у, то *у может появиться там же, где и любая
другая переменная, не являющаяся указателем. Таким образом,
следующие выражения вполне допустимы:
Первое из них заносит число 7 в ячейку памяти по адресу
у, второе увеличивает значение по адресу х в пять раз,
третье добавляет единицу к содержимому ячейки памяти с адресом z.
В последнем случае круглые скобки необходимы, так как операции с одинаковым
приоритетом выполняются справа налево. В результате если, например,
*z = 5, то (*z)++ приведет к тому, что *z = 6, а
*z++ всего лишь изменит сам адрес z (операция ++
выполняется над адресом z, а не над значением *z по этому
адресу).
Указатели можно использовать как операнды в арифметических
операциях. Если у - указатель, то унарная операция y++
увеличивает его значение; теперь оно является адресом следующего элемента.
Указатели и целые числа можно складывать. Конструкция у + n
(у - указатель, n - целое число) задает адрес n-гo
объекта, на который указывает у. Это справедливо для любых объектов
(int, char, float и др.); транслятор будет масштабировать приращение
адреса в соответствии с типом, указанным в определении объекта.
Любой адрес можно проверить на равенство (==) или неравенство
(!=) со специальным значением NULL, которое позволяет определить ничего не
адресующий указатель.
Циклы организуются, чтобы выполнить некоторый оператор или
группу операторов определенное число раз. В языке Си три оператора цикла:
for, while и do - while. Первый из них формально записывается, в следующем
виде:
Тело цикла составляет либо один оператор, либо несколько
операторов, заключенных в фигурные скобки { ... } (после блока точка с
запятой не ставится). В выражениях 1, 2, 3 фигурирует специальная переменная,
называемая управляющей. По ее значению устанавливается
необходимость повторения цикла или выхода из него.
Выражение_1 присваивает начальное значение управляющей
переменной, выражение_З изменяет его на каждом шаге, а выражение_2 проверяет,
не достигло ли оно граничного значения, устанавливающего необходимость
выхода из цикла.
Примеры:
Любое из трех выражений в цикле for может отсутствовать,
однако точка с запятой должна оставаться. Таким образом, for ( ; ; ) {...} -
это бесконечный цикл, из которого можно выйти лишь другими способами.
В языке Си принято следующее правило. Любое выражение с
операцией присваивания, заключенное в круглые скобки, имеет значение, равное
присваиваемому. Например, выражение (а=7+2) имеет значение 9. После этого
можно записать другое выражение, например: ((а=7+2)<10), которое в данном
случае будет всегда давать истинное значение. Следующая конструкция:
позволяет вводить значение переменной сh и давать истинный
результат только тогда, когда введенным значением является буква 'i'. В скобках
можно записывать и несколько формул, составляющих сложное выражение. Для
этих целей используется операция запятая. Формулы будут вычисляться слева
направо, и все выражение примет значение последней вычисленной формулы.
Например, если имеются две переменные типа char, то выражение
определяет следующие действия: значение переменной у
присваивается переменной х; вводится символ с клавиатуры и присваивается
переменной у; z получает значение переменной у. Скобки здесь необходимы,
поскольку операция запятая имеет более низкий приоритет, чем операция
присваивания, записанная после переменной z. Операция запятая находит
широкое применение для построения выражений цикла for и позволяет
параллельно изменять значения нескольких управляющих переменных.
Допускаются вложенные конструкции, т.е. в теле некоторого
цикла могут встречаться другие операторы for.
Оператор while формально записывается в таком виде:
Выражение в скобках может принимать ненулевое (истинное)
или нулевое (ложное) значение. Если оно истинно, то выполняется тело цикла
и выражение вычисляется снова. Если выражение ложно, то цикл while
заканчивается.
Оператор do-while формально записывается следующим образом:
Основным отличием между циклами while и do - while является
то, что тело в цикле do - while выполняется по крайней мере один раз. Тело
цикла будет выполняться до тех пор, пока выражение в скобках не примет ложное
значение. Если оно ложно при входе в цикл, то его тело выполняется ровно один
раз.
Допускается вложенность одних циклов в другие, т.е. в теле
любого цикла могут появляться операторы for, while и do - while.
В теле цикла могут использоваться новые операторы break и
continue. Оператор break обеспечивает немедленный выход из цикла, оператор
continue вызывает прекращение очередной и начало следующей итерации.
Для организации условных и безусловных переходов в
программе на языке Си используются операторы: if - else, switch и goto. Первый
из них записывается следующим образом:
Если условие в скобках принимает истинное значение,
выполняется оператор_1, если ложное - оператор_2. Если вместо одного
необходимо выполнить несколько операторов, то они заключаются в фигурные
скобки. В операторе if слово else может отсутствовать.
В операторе if - else непосредственно после ключевых слов
if и else должны следовать другие операторы. Если хотя бы один из них является
оператором if, его называют вложенным. Согласно принятому в языке Си
соглашению слово else всегда относится к ближайшему предшествующему ему if.
Оператор switch позволяет выбрать одну из нескольких
альтернатив. Он записывается в следующем формальном виде:
Здесь вычисляется значение целого выражения в скобках (его
иногда называют селектором) и оно сравнивается со всеми константами
(константными выражениями). Все константы должны быть различными. При
совпадении выполнится соответствующий вариант операторов (один или несколько
операторов). Вариант с ключевым словом default реализуется, если ни один
другой не подошел (слово default может и отсутствовать). Если default
отсутствует, а все результаты сравнения отрицательны, то ни один вариант
не выполняется.
Для прекращения последующих проверок после успешного выбора
некоторого варианта используется оператор break, обеспечивающий
немедленный выход из переключателя switch.
Допускаются вложенные конструкции switch.
Рассмотрим правила выполнения безусловного перехода,
который можно представить в следующей форме:
Метка - это любой идентификатор, после которого поставлено
двоеточие. Оператор goto указывает на то, что выполнение программы необходимо
продолжить начиная с оператора, перед которым записана метка. Метку
можно поставить перед любым оператором в той функции, где находится
соответствующий ей оператор goto. Ее не надо объявлять.
Массив состоит из элементов одного и того же типа.
Ко всему массиву целиком можно обращаться по имени. Кроме того, можно выбирать
любой элемент массива. Для этого необходимо задать индекс, который указывает
на его относительную позицию. Число элементов массива назначается при его
определении и в дальнейшем не изменяется. Если массив объявлен, то к любому
его элементу можно обратиться следующим образом: указать имя массива и индекс
элемента в квадратных скобках. Массивы определяются так же, как и переменные:
В первой строке объявлен массив а из 100 элементов целого типа:
а[0], а[1], ..., а[99] (индексация всегда начинается с нуля). Во второй
строке элементы массива b имеют тип char, а в третьей - float.
Двумерный массив представляется как одномерный, элементами
которого так же являются массивы. Например, определение char а[10][20]; задает
такой массив. По аналогии можно установить и большее число измерений. Элементы
двумерного массива хранятся по строкам, т.е. если проходить по ним в порядке
их расположения в памяти, то быстрее всего изменяется самый правый индекс.
Например, обращение к девятому элементу пятой строки запишется так: а[5][9].
Пусть задан массив:
Тогда элементы массива а будут размещаться в памяти
следующим образом: a[0][0], a[0][1], a[0][2], a[1][0], a[1][1], a[1][2].
Имя массива - это константа, которая содержит адрес его
первого элемента (в данном примере а содержит адрес элемента а[0][0]).
Предположим, что a = 1000. Тогда адрес элемента а[0][1] будет равен 1002
(элемент типа int занимает в памяти 2 байта), адрес следующего элемента
а[0][2] - 1004 и т.д. Что же произойдет, если выбрать элемент, для которого
не выделена память? К сожалению, компилятор не отслеживает данной ситуации.
В результате возникнет ошибка и программа будет работать неправильно.
В языке Си существует сильная взаимосвязь между указателями
и массивами. Любое действие, которое достигается индексированием массива,
можно выполнить и с помощью указателей, причем последний вариант будет
работать быстрее.
Определение
задает массив из пяти элементов а[0], a[1], a[2], a[3],
a[4]. Если объект *у определен как
то оператор у = &a[0]; присваивает переменной у адрес
элемента а[0]. Если переменная у указывает на очередной элемент массива а,
то y+1 указывает на следующий элемент, причем здесь выполняется соответствующее
масштабирование для приращения адреса с учетом длины объекта (для типа int -
2 байта, long - 4 байта, double - 8 байт и т.д.).
Так как само имя массива есть адрес его нулевого элемента,
то оператор у = &a[0]; можно записать и в другом виде: у = а. Тогда элемент
а[1] можно представить как *(а+1). С другой стороны, если у - указатель
на массив a, то следующие две записи: a[i] и *(у+i) - эквивалентны.
Между именем массива и соответствующим указателем есть одно
важное различие. Указатель - это переменная и у = а; или y++; - допустимые
операции. Имя же массива - константа, поэтому конструкции вида a = y;
a++; использовать нельзя, так как значение константы постоянно и не может
быть изменено.
Переменные с адресами могут образовывать некоторую
иерархическую структуру (могут быть многоуровневыми) типа указатель на
указатель (т.е. значение указателя является адресом другого указателя),
указатель на указатель на указатель и т.д. Если указатели адресуют элементы
одного массива, то их можно сравнивать (отношения вида <, >, = =, != и
другие работают правильно). В то же время нельзя сравнивать ли6о использовать
в арифметических операциях указатели на разные массивы (соответствующие
выражения не приводят к ошибкам при компиляции, но в большинстве случаев не
имеют смысла). Любой адрес можно проверить на равенство или неравенство с
константой NULL. Указатели на элементы одного массива можно также вычитать.
Тогда результатом будет число элементов массива, расположенных между
уменьшаемым и вычитаемым объектами.
Язык Си позволяет инициализировать массив при его
определении. Для этого используется следующая форма:
Примеры:
В последнем случае: b[0][0] = 1, b[0][1] = 2, b[0][2] = 3,
b[1][0] = 4, b[1][1] = 5, b[1][2] = 6.
В языке допускаются массивы указателей, которые определяются,
например, следующим образом: char *m[5];. Здесь m[5] - массив, содержащий
адреса элементов типа char.
Язык Си не поддерживает отдельный строковый тип данных, но
он позволяет определить строки двумя различными способами. В первом
используется массив символов, а во втором - указатель на первый символ массива.
Определение char а[10]; указывает компилятору на
необходимость резервирования места для максимум 10 символов. Константа а
содержит адрес ячейки памяти, в которой помещено значение первого из десяти
объектов типа char. Процедуры, связанные с занесением конкретной строки
в массив а, копируют ее по одному символу в область памяти, на которую
указывает константа а, до тех пор, пока не будет скопирован нулевой символ,
оканчивающий строку. Когда выполняется функция типа printf("%s", а), ей
передается значение а, т.е. адрес первого символа, на который указывает а.
Если первый символ - нулевой, то работа функции printf() заканчивается, а
если нет, то она выводит его на экран, прибавляет к адресу единицу и снова
начинает проверку на нулевой символ. Такая обработка позволяет снять
ограничения на длину строки (конечно, в пределах объявленной размерности):
строка может иметь любую длину, но в пределах доступной памяти.
Инициализировать строку при таком способе определения можно
следующим образом:
Второй способ определения строки - это использование
указателя на символ. Определение char *b; задает переменную b, которая может
содержать адрес некоторого объекта. Однако в данном случае компилятор не
резервирует место для хранения символов и не инициализирует переменную b
конкретным значением. Когда компилятор встречает оператор вида b ="IBM PC";,
он производит следующие действия. Во-первых, как и в предыдущем случае, он
создает в каком-либо месте объектного модуля строку "IBM PC", за которой
следует нулевой символ ('\0'). Во-вторых, он присваивает значение начального
адреса этой строки (адрес символа 'I') переменной b. Функция printf("%s", b)
работает так же, как и в предыдущем случае, осуществляя вывод символов до тех
пор, пока не встретится заключительный нуль.
Массив указателей можно инициализировать, т.е. назначать
его элементам конкретные адреса некоторых заданных строк при определении.
Для ввода и вывода строк символов помимо scanf( ) и printf()
могут использоваться функции gets( ) и puts( ) (их прототипы находятся в файле
stdio.h).
Если string - массив символов, то ввести строку с клавиатуры можно
так:
(ввод оканчивается нажатием клавиши <Enter>). Вывести
строку на экран можно следующим образом:
Отметим также, что для работы со строками существует
специальная библиотека функций, прототипы которых находятся в файле string.h.
Наиболее часто используются функции strcpy( ), strcat( ),
strlen( ) и strcmp( ).
Если string1 и string2 - массивы символов, то вызов функции
strcpy( ) имеет вид:
Эта функция служит для копирования содержимого строки
string2 в строку string1. Массив string1 должен быть достаточно большим, чтобы
в него поместилась строка string2. Так как компилятор не отслеживает этой
ситуации, то недостаток места приведет к потере данных.
Вызов функции strcat( ) имеет вид:
Эта функция присоединяет строку string2 к строке string1 и
помещает ее в массив, где находилась строка string1, при этом строка string2
не изменяется. Нулевой байт, который завершал первую строку, заменяется первым
байтом второй строки.
Функция strlen( ) возвращает длину строки, при этом
завершающий нулевой байт не учитывается. Если a - целое, то вызов функции
имеет вид:
Функция strcmp( ) сравнивает две строки и возвращает 0,
если они равны.
Структура - это объединение одного или нескольких объектов
(переменных, массивов, указателей, других структур и т.д.). Как и массив, она
представляет собой совокупность данных. Отличием является то, что к ее
элементам необходимо обращаться по имени и что различные элементы структуры
не обязательно должны принадлежать одному типу.
Объявление структуры осуществляется с помощью ключевого
слова struct, за которым идет ее тип и далее список элементов, заключенных
в фигурные скобки:
Именем элемента может быть любой идентификатор. Как и выше,
в одной строке можно записывать через запятую несколько идентификаторов одного
типа.
Рассмотрим пример:
Следом за фигурной скобкой, заканчивающей список элементов,
могут записываться переменные данного типа, например:
(при этом выделяется соответствующая память). Описание без
последующего списка не выделяет никакой памяти; оно просто задает форму
структуры. Введенное имя типа позже можно использовать для объявления структуры,
например:
Теперь переменная days имеет тип date.
При необходимости структуры можно инициализировать, помещая
вслед за описанием список начальных значений элементов.
Разрешается вкладывать структуры друг в друга, например:
Определенный выше тип data включает три элемента: day,
month, year, содержащий целые значения (int). Структура man включает элементы
name, fam, bd и voz. Первые два - name[20] и fam[20] - это символьные массивы
из 20 элементов каждый. Переменная bd представлена составным элементом
(вложенной структурой) типа data. Элемент age содержит значения целого типа
int). Теперь можно определить переменные, значения которых принадлежат
введенному типу:
Здесь определен массив man_, состоящий из 100 структур типа
man.
Чтобы обратиться к отдельному элементу структуры,
необходимо указать его имя, поставить точку и сразу же за ней записать имя
нужного элемента, например:
При работе со структурами необходимо помнить, что тип
элемента определяется соответствующей строкой описания в фигурных скобках.
Например, массив man_ имеет тип man, year является целым числом и т.п.
Поскольку каждый элемент структуры относится к определенному типу, его имя
может появиться везде, где разрешено использование значений этого типа.
Допускаются конструкции вида man_[i]=man_[j]; где man_[i] и man_[j] - объекты,
соответствующие единому описанию структуры. Другими словами, разрешается
присваивать одну структуру другой по их именам.
Унарная операция & позволяет взять адрес структуры.
Предположим, что определена переменная day:
Здесь day - это структура типа date, включающая три
элемента: d, m, у. Другое определение
устанавливает тот факт, что db - это указатель на структуру
типа date.
Запишем выражение:
В этом случае для выбора элементов d, m, у структуры
необходимо использовать конструкции:
Действительно, db - это адрес структуры, *db - сама
структура. Круглые скобки здесь необходимы, так как точка имеет более высокий,
чем звездочка, приоритет. Для аналогичных целей в языке Си предусмотрена
специальная операция ->. Эта операция выбирает элемент структуры и
позволяет представить рассмотренные выше конструкции в более простом виде:
Рассмотрим описание структуры:
Здесь фактически вводится новый тип данных - data. Теперь
его можно использовать для объявления конкретных экземпляров структуры,
например:
В язык Си введено специальное средство, позволяющее
назначать имена типам данных (переименовывать). Таким средством является
оператор typedef. Он записывается в следующем виде:
Здесь "тип" - любой разрешенный тип данных и "имя" - любой
разрешенный идентификатор.
Рассмотрим пример:
После этого можно сделать объявление:
Оно будет выполнять то же самое, что и привычное объявление
int a,b;. Другими словами, INTEGER можно использовать как синоним ключевого
слова int.
Особую разновидность структур представляют собой битовые
поля. Битовое поле - это последовательность соседних битов внутри одного,
целого значения. Оно может иметь тип signed int или unsigned int и занимать
от 1 до 16 битов. Поля размещаются в машинном слове в направлении от младших
к старшим разрядам. Например, структура:
обеспечивает размещение данных в двух байтах (в одном слове).
Если бы последнее поле было задано так: unsigned d:6, то оно размещалось бы не
в первом слове, а в разрядах 0 - 5 второго слова.
В полях типа signed крайний левый бит является знаковым.
Поля используются для упаковки значений нескольких
переменных в одно машинное слово с целью экономии памяти. Они не могут быть
массивами и не имеют адресов, поэтому к ним нельзя применять унарную операцию &.
Объединение - это некоторая переменная, которая может
хранить (в разное время) объекты различного типа и размера. В результате
появляется возможность работы в одной и той же области памяти с данными
различного вида. Для описания объединения используется ключевое слово union,
а соответствующий синтаксис аналогичен структурам.
Пусть задано определение:
Здесь ir имеет размер 2 байта, fr - 4 байта, cr - 1 байт.
Размер переменной z будет равен размеру самого большого из трех приведенных
типов (т.е. 4 байтам). В один и тот же момент времени z может иметь значение
только одной из переменных ir, fr или cr.
Перечислимый тип данных предназначен для описания объектов
из некоторого заданного множества. Он задается ключевым словом enum. Рассморим
пример:
Здесь введен новый тип данных seasons. Теперь можно
определить переменные этого типа:
Каждая из них (а, b, c) может принимать одно из четырех
значений: spring, summer, autumn и winter. Эти переменные можно было определить
сразу при описании типа:
Рассмотрим еще один пример:
Имена, занесенные в days (также как и в seasons в предыдущем примере),
представляют собой константы целого типа. Первая из них (mon) автоматически
устанавливается в нуль, и каждая следующая имеет значение на единицу больше,
чем предыдущая (tues=1, wed=2 и т.д.).
Можно присвоить константам определенные значения целого типа
(именам, не имеющим их, будут, как и раньше, назначены значения предыдущих
констант, увеличенные на единицу). Например:
После этого mon=5, tues=8,wed=10, thur=11, fri=12, sat=13,
sun=14.
Тип enum можно использовать для задания констант true=1 и
false=0, например:
Программы на языке Си обычно состоят из большого числа
отдельных функций (подпрограмм). Как правило, эти функции имеют небольшие
размеры и могут находиться как в одном, так и в нескольких файлах. Все функции
являются глобальными. В языке запрещено определять одну функцию внутри
другой. Связь между функциями осуществляется через аргументы, возвращаемые
значения и внешние переменные.
В общем случае функции в языке Си необходимо объявлять.
Объявление функции (т.е. описание заголовка) должно предшествовать ее
использованию, а определение функции (т.е. полное описание) может быть
помещено как после тела программы (т.е. функции main( )), так и до него. Если
функция определена до тела программы, а также до ее вызовов из определений
других функций, то объявление может отсутствовать. Как уже отмечалось, описание
заголовка функции обычно называют прототипом функции.
Функция объявляется следующим образом:
Тип функции определяет тип значения, которое возвращает
функция. Если тип не указан, то предполагается, что функция возвращает целое
значение (int).
При объявлении функции для каждого ее параметра можно
указать только его тип (например: тип функция (int, float, ...), а можно дать
и его имя (например: тип функция (int а, float b, ...) ).
В языке Си разрешается создавать функции с переменным числом
параметров. Тогда при задании прототипа вместо последнего из них указывается
многоточие.
Определение функции имеет следующий вид:
Передача значения из вызванной функции в вызвавшую
происходит с помощью оператора возврата return, который записывается следующим
образом:
Таких операторов в подпрограмме может быть несколько, и
тогда они фиксируют соответствующие точки выхода. Например:
Вызвать эту функцию можно следующим образом:
Вызвавшая функция может, при необходимости, игнорировать
возвращаемое значение. После слова return можно ничего не записывать; в этом
случае вызвавшей функции никакого значения не передается. Управление передается
вызвавшей функции и в случае выхода "по концу" (последняя закрывающая фигурная
скобка).
В языке Си аргументы функции передаются по значению, т.е.
вызванная функция получает свою временную копию каждого аргумента, а не его
адрес. Это означает, что вызванная функция не может изменить значение
переменной вызвавшей ее программы. Однако это легко сделать, если передавать в
функцию не переменные, а их адреса. Например:
Вызов swap(&b, &c) (здесь подпрограмме передаются адреса
переменных b и с) приведет к тому, что значения переменных b и c поменяются
местами.
Если же в качестве аргумента функции используется имя
массива, то передается только адрес начала массива, а сами элементы не
копируются. Функция может изменять элементы массива, сдвигаясь
(индексированием) от его начала.
Рассмотрим, как функции можно передать массив в виде
параметра. Здесь возможны три варианта: Независимо от выбранного варианта вызванной функции
передается указатель на начало массива. Сами же элементы массива не копируются.
Если некоторые переменные, константы, массивы, структуры
объявлены как глобальные, то их не надо включать в список параметров вызванной
функции.
В языке Си различают четыре основных класса памяти: внешнюю
(глобальную), автоматическую (локальную), статическую и регистровую память.
Внешние (глобальные) переменные определены вне функций и,
следовательно, доступны для любой из них. Они могут быть определены только
один раз. Выше уже говорилось, что сами функции всегда глобальные. Язык не
позволяет определять одни функции внутри других. Область действия внешней
переменной простирается от точки во входном файле, где она объявлена,
до конца файла. Если на внешнюю переменную нужно ссылаться до ее определения
или она определена в другом входном файле, то в подпрограмме или файле она
должна быть объявлена как extern.
Например:
Автоматические переменные по отношению к функциям являются
внутренними или локальными. Они начинают существовать при входе в функцию и
уничтожаются при выходе из нее (для них можно использовать ключевое слово auto).
Однако оно практически не используется, так как при отсутствии ключевого слова
переменные по умолчанию принадлежат к классу auto.
Статические переменные объявляются с помощью ключевого слова
static. Они могут быть внутренними (локальными) или внешними (глобальными).
Внутренние статические переменные, как и автоматические, локальны по отношению
к отдельной функции. Однако они продолжают существовать, а не возникают и не
уничтожаются при каждом ее вызове. Другими словами, они являются собственной
постоянной памятью для функции. Внешние статические переменные доступны внутри
оставшейся части файла после того, как они в нем объявлены, однако в других
файлах они неизвестны. Это, в частности, позволяет скрыть данные одного файла
от другого файла.
Регистровые переменные относятся к последнему классу.
Ключевое слово register говорит о том, что переменная, о которой идет речь,
будет интенсивно использоваться. Если возможно, значения таких переменных
помещаются во внутренние регистры микропроцессора, что может привести к
более быстрой и короткой программе (разработчики компиляторов фирмы Borland
утверждают, что оптимизация компиляторов данной фирмы по использованию
регистровых переменных сделана так хорошо, что указание использовать переменную
как регистровую может только снизить эффективность создаваемого машинного
кода). Для регистровых переменных нельзя взять адрес; они могут быть только
автоматическими с допустимыми типами int или char.
Таким образом, можно выделить четыре модификатора класса
памяти: extern, auto, static, register. Они используются в следующей общей
форме:
Выше уже говорилось об инициализации, т.е. о присвоении
различным объектам начальных значений. Если явная инициализация отсутствует,
гарантируется, что внешние и статические переменные будут иметь значение
нуль, а автоматические и регистровые - неопределенное значение.
В языке Си сама функция не может быть значением переменной,
но можно определить указатель на функцию. С ним уже можно обращаться как с
переменной: передавать его другим функциям, помещать в массивы и т.п.
Код функции в персональном компьютере занимает физическую
память. В этой памяти есть точка входа, которая используется для того, чтобы
войти в функцию и запустить ее на выполнение. Указатель на функцию как раз и
адресует эту точку входа. Это уже будет обычная переменная и с ней можно
делать все, что можно делать с переменной.
Через указатель можно войти в функцию, т.е. запустить ее на
выполнение. Объявление вида:
говорит о том, что f - это указатель на функцию,
возвращающую целое значение. Первая пара скобок необходима, без них int *f( );
означало бы, что f - функция, возвращающая указатель на целое значение. После
объявления указателя на функцию в программе можно использовать объекты: *f -
сама функция; f - указатель на функцию. Для любой функции ее имя (без скобок
и аргументов) является указателем на эту функцию.
В программы на языке Си можно передавать некоторые
аргументы. Когда вначале вычислений производится обращение к main( ), ей
передаются три параметра. Первый из них определяет число командных аргументов
при обращении к программе. Второй представляет собой массив указателей на
символьные строки, содержащие эти аргументы (в одной строке - один аргумент).
Третий тоже является массивом указателей на символьные строки, он используется
для доступа к параметрам операционной системы (к переменным окружения).
Любая такая строка представляется в виде:
Последнюю строку можно найти по двум заключительным нулям.
Назовем аргументы функции main( ) соответственно: argc,
argv и env (возможны и любые другие имена). Тогда допустимы следующие описания:
Предположим, что на диске A: есть некоторая программа
prog.exe. Обратимся к ней следующим образом:
Тогда argv[0] - это указатель на строку A:\prog.exe,
argv[1] - на строку file1 и т.д. На первый фактический аргумент указывает
argv[1], а на последний - argv[3]. Если argc=1, то после имени программы в
командной строке параметров нет. В нашем примере argc=4.
Рекурсией называется такой способ вызова, при котором
функция обращается к самой себе.
Важным моментом при составлении рекурсивной программы
является организация выхода. Здесь легко допустить ошибку, заключающуюся в том,
что функция будет последовательно вызывать саму себя бесконечно долго. Поэтому
рекурсивный процесс должен шаг за шагом так упрощать задачу, чтобы в конце
концов для нее появилось не рекурсивное решение. Использование рекурсии не
всегда желательно, так как это может привести к переполнению стека.
В системах программирования подпрограммы для решения часто
встречающихся задач объединяются в библиотеки. К числу таких задач относятся:
вычисление математических функций, ввод/вывод данных, обработка строк,
взаимодействие со средствами операционной системы и др. Использование
библиотечных подпрограмм избавляет пользователя от необходимости разработки
соответствующих средств и предоставляет ему дополнительный сервис. Включенные
в библиотеки функции поставляются вместе с системой программирования. Их
объявления даны в файлах *.h (это так называемые включаемые или заголовочные
файлы). Поэтому, как уже упоминалось выше, в начале программы с библиотечными
функциями должны быть строки вида:
Например:
Существуют также средства для расширения и создания новых
библиотек с программами пользователя.
Файлом называют способ хранения информации на физическом
устройстве. Файл - это понятие, которое применимо ко всему - от файла на диске
до терминала.
В языке Си отсутствуют операторы для работы с файлами. Все
необходимые действия выполняются с помощью функций, включенных в стандартную
библиотеку. Они позволяют работать с различными устройствами, такими, как диски,
принтер, коммуникационные каналы и т.д. Эти устройства сильно отличаются друг
от друга. Однако файловая система преобразует их в единое абстрактное
логическое устройство, называемое потоком.
В Си существует два типа потоков: текстовые (text) и
двоичные (binary).
Текстовый поток - это последовательность символов.
При передаче символов из потока на экран, часть из них не выводится (например,
символ возврата каретки, перевода строки).
Двоичный поток - это последовательность байтов,
которые однозначно соответствуют тому, что находится на внешнем устройстве.
Прежде чем читать или записывать информацию в файл, он
должен быть открыт и тем самым связан с потоком. Это можно сделать с помощью
библиотечной функции fopen( ). Она берет внешнее представление файла (например,
c:\my_prog.txt) и связывает его с внутренним логическим именем, которое
используется далее в программе. Логическое имя - это указатель на требуемый
файл. Его необходимо определить; делается это, например, так:
Здесь FILE - имя типа, описанное в стандартном заголовочном
файле stdio.h, fp - указатель на файл. Обращение к функции fopen( ) в программе
осуществляется выражением:
Спецификация файла (т.е. имя файла и путь к нему) может,
например, иметь вид: "c:\\my_prog.txt" - для файла my_prog.txt на диске с:.
Способ использования файла задается следующими символами: Если режим t или b не задан (например, r, w или а), то он
определяется значением глобальной переменной _fmode. Если fmode=0_BINARY, то
файлы открываются в двоичном режиме, а если _fmode=0_TEXT - в текстовом
режиме. Константы 0_BINARY и 0_ТЕXТ определены в файле fcntl.h.
Строки вида r+b можно записывать и в другой форме: rb+.
Если в результате обращения к функции fopen( ) возникает
ошибка, то она возвращает константу NULL.
Рекомендуется использовать следующий способ открытия файла:
После окончания работы с файлом он должен быть закрыт.
Это делается с помощью библиотечной функции fclose( ). Она имеет следующий
прототип:
При успешном завершении операции функция fclose( )
возвращает значение нуль. Любое другое значение свидетельствует об ошибке.
Рассмотрим другие библиотечные функции, используемые для
работы с файлами (все они описаны в файле stdio.h):
1. Функция putc( ) записывает символ в файл и имеет
следующий прототип:
Здесь fp - указатель на файл, возвращенный функцией
fopen( ), с - символ для записи (переменная с имеет тип int, но используется
только младший байт). При успешном завершении putc( ) возвращает записанный
символ, в противном случае возвращается константа EOF. Она определена в
файле stdio.h и имеет значение -1.
2. Функция getc( ) читает символ из файла и имеет следующий
прототип:
Здесь fp - указатель на файл, возвращенный функцией fopen( ).
Эта функция возвращает прочитанный символ. Соответствующее значение имеет тип
int, но старший байт равен нулю. Если достигнут конец файла, то getc( )
возвращает значение ЕОF.
3. Функция feof( ) определяет конец файла при чтении
двоичных данных и имеет следующий прототип:
Здесь fp - указатель на файл, возвращенный функцией fopen( ).
При достижении конца файла возвращается ненулевое значение, в противном случае
возвращается 0.
4. Функция fputs( ) записывает строку символов в файл. Она
отличается от функции puts( ) только тем, что в качестве второго параметра
должен быть записан указатель на переменную файлового типа.
Например:
При возникновении ошибки возвращается значение EOF.
5. Функция fgets( ) читает строку символов из файла. Она
отличается от функции gets( ) тем, что в качестве второго параметра должно
быть указано максимальное число вводимых символов плюс единица, а в качестве
третьего - указатель на переменную файлового типа. Строка считывается целиком,
если ее длина не превышает указанного числа символов, в противном случае
функция возвращает только заданное число символов.
Рассмотрим пример:
Функция возвращает указатель на строку string при успешном
завершении и константу NULL в случае ошибки либо достижения конца файла.
6. Функция fprintf( ) выполняет те же действия, что и
функция printf( ), но работает с файлом. Ее отличием является то, что в
качестве первого параметра задается указатель на переменную файлового типа.
Например:
7. Функция fscanf( ) выполняет те же действия, что и
функция scanf(), но работает с файлом. Ее отличием является то, что в качестве
первого параметра задается указатель на переменную файлового типа.
Например:
При достижении конца файла возвращается значение EOF.
8. Функция fseek( ) позволяет выполнять чтение и запись
с произвольным доступом и имеет следующий прототип:
Здесь fp - указатель на файл, возвращенный функцией
fopen( ), count - номер байта относительно заданной начальной позиции,
начиная с которого будет выполняться операция, access - способ задания
начальной позиции.
Переменная access может принимать следующие значения: При успешном завершении возвращается нуль, при ошибке -
ненулевое значение.
9. Функция ferror( ) позволяет проверить правильность
выполнения последней операции при работе с файлами. Имеет следующий прототип:
В случае ошибки возвращается ненулевое значение, в противном
случае возвращается нуль.
10. Функция remove( ) удаляет файл и имеет следующий
прототип:
Здесь file_name - указатель на строку со спецификацией
файла. При успешном завершении возвращается нуль, в противном случае
возвращается ненулевое значение.
11. Функция rewind( ) устанавливает указатель текущей
позиции в начало файла и имеет следующий прототип:
12. Функция fread( ) предназначена для чтения блоков данных из
потока. Имеет прототип:
Она читает n элементов данных, длиной size байт каждый, из
заданного входного потока fp в блок, на который указывает указатель ptr. Общее
число прочитанных байтов равно произведению n*size. При успешном завершении
функция fread( ) возвращает число прочитанных элементов данных, при ошибке - 0.
13. Функция fwrite( ) предназначена для записи в файл блоков
данных. Имеет прототип:
Она добавляет n элементов данных, длиной size байт каждый,
в заданный выходной файл fp. Данные записываются с позиции, на которую
указывает указатель ptr. При успешном завершении операции функция fwrite( )
возвращает число записанных элементов данных, при ошибке - неверное число
элементов данных.
В языке Си имеются пять стандартных файлов со следующими
логическими именами:
В языке Си имеется также система низкоуровневого
ввода/вывода (без буферизации и форматирования данных), соответствующая
стандарту системы UNIX. Прототипы составляющих ее функций находятся в файле
io.h. К этим функциям относятся:
В языке Си принято следующее распределение памяти:
Таблица 4
Для глобальных переменных отводится фиксированное место в
памяти на все время работы программы. Локальные переменные хранятся в стеке.
Между ними находится область памяти для динамического распределения.
Функции malloc( ) и free( ) используются для динамического
распределения свободной памяти. Функция malloc( ) выделяет память, функция
free( ) освобождает ее. Прототипы этих функций хранятся в заголовочном файле
stdlib.h и имеют вид:
Функция malloc( ) возвращает указатель типа void; для
правильного использования значение функции надо преобразовать к указателю на
соответствующий тип. При успешном выполнении функция возвращает указатель на
первый байт свободной памяти размера size. Если достаточного количества памяти
нет, возвращается значение 0. Чтобы определить количество байтов, необходимых
для переменной, используют операцию sizeof( ).
Пример использования этих функций:
Перед использованием указателя, возвращаемого malloc( ),
необходимо убедиться, что памяти достаточно (указатель не нулевой).
Препроцессор Си - это программа, которая обрабатывает
входные данные для компилятора. Препроцессор просматривает исходную программу
и выполняет следующие действия: подключает к ней заданные файлы, осуществляет
подстановки, а также управляет условиями компиляции. Для препроцессора
предназначены строки программы, начинающиеся с символа #. В одной строке
разрешается записывать только одну команду (директиву препроцессора).
Директива
вызывает замену в последующем тексте программы названного
идентификатора на текст подстановки (обратите внимание на отсутствие точки с
запятой в конце этой команды). По существу, эта директива вводит
макроопределение (макрос), где "идентификатор" - это имя макроопределения,
а "подстановка" - последовательность символов, на которые препроцессор заменяет
указанное имя, когда находит его в тексте программы. Имя макроопределения
принято набирать прописными буквами.
Рассмотрим примеры:
Первая строка вызывает замену в программе идентификатора MAX
на константу 25. Вторая позволяет использовать в тексте вместо открывающей
фигурной скобки ( { ) слово BEGIN.
Отметим, что поскольку препроцессор не проверяет
совместимость между символическими именами макроопределений и контекстом, в
котором они используются, то рекомендуется такого рода идентификаторы
определять не директивой #define, а с помощью ключевого слова const с явным
указанием типа (это в большей степени относится к Си++):
(тип int можно не указывать, так как он устанавливается
по умолчанию).
Если директива #define имеет вид:
причем между первым идентификатором и открывающей круглой
скобкой нет пробела, то это определение макроподстановки с аргументами.
Например, после появления строки вида:
оператор READ(y); воспринимается так же, как scanf("%d",&y);.
Здесь val - аргумент и выполнена макроподстановка с аргументом.
При наличии длинных определений в подстановке,
продолжающихся в следующей строке, в конце очередной строки с продолжением
ставится символ \.
В макроопределение можно помещать объекты, разделенные
знаками ##, например:
После этого PR(а, 3) вызовет подстановку а3. Или, например,
макроопределение
Символ #, помещаемый перед макроаргументом, указывает на
преобразование его в строку. Например, после директивы
следующий фрагмент текста программы
преобразуется так:
Опишем другие директивы препроцессора. Директива #include уже
встречалась ранее. Ее можно использовать в двух формах:
Действие обеих команд сводится к включению в программу
файлов с указанным именем. Первая из них загружает файл из текущего или
заданного в качестве префикса каталога. Вторая команда осуществляет поиск
файла в стандартных местах, определенных в системе программирования. Если
файл, имя которого записано в двойных кавычках, не найден в указанном каталоге, то
поиск будет продолжен в подкаталогах, заданных для команды #include <...>. Директивы #include могут вкладываться одна в другую.
Следующая группа директив позволяет избирательно
компилировать части программы. Этот процесс называется условной компиляцией.
В эту группу входят директивы #if, #else, #elif, #endif, #ifdef, #ifndef.
Основная форма записи директивы #if имеет вид:
Здесь проверяется значение константного выражения. Если оно
истинно, то выполняется заданная последовательность операторов, а если ложно,
то эта последовательность операторов пропускается.
Действие директивы #else подобно действию команды else в
языке Си, например:
Здесь если константное выражение истинно, то выполняется
последовательность_операторов_1, а если ложно - последовательность_операторов_2.
Директива #elif означает действие типа "else if". Основная
форма ее использования имеет вид:
Эта форма подобна конструкции языка Си вида: if...else
if...else if...
Директива
устанавливает определен ли в данный момент указанный
идентификатор, т.е. входил ли он в директивы вида #define. Строка вида
проверяет является ли неопределенным в данный момент
указанный идентификатор. За любой из этих директив может следовать произвольное
число строк текста, возможно, содержащих инструкцию #else (#elif использовать
нельзя) и заканчивающихся строкой #endif. Если проверяемое условие истинно,
то игнорируются все строки между #else и #endif, а если ложно, то строки
между проверкой и #else (если слова #else нет, то #endif). Директивы #if
и #ifndef могут "вкладываться" одна в другую.
Директива вида
приводит к тому, что указанный идентификатор начинает
считаться неопределенным, т.е. не подлежащим замене.
Рассмотрим примеры. Три следующие директивы:
проверяют определен ли идентификатор WRITE (т.е. была ли
команда вида #define WRITE...), и если это так, то имя WRITE начинает
считаться неопределенным, т.е. не подлежащим замене.
Директивы
проверяют является ли идентификатор WRITE неопределенным,
и если это так, то определятся идентификатор WRITE вместо имени fprintf.
Директива #error записывается в следующей форме:
Если она встречается в тексте программы, то компиляция
прекращается и на экран дисплея выводится сообщение об ошибке. Эта команда в
основном применяется на этапе отладки. Заметим, что сообщение об ошибке не
надо заключать в двойные кавычки.
Директива #line предназначена для изменения значений
переменных _LINE_ и _FILE_, определенных в системе программирования Си.
Переменная _LINE_ содержит номер строки программы, выполняемой в текущий
момент времени. Идентификатор _FILE_ является указателем на строку с именем
компилируемой программы. Директива #line записывается следующим образом:
Здесь номер - это любое положительное целое число, которое
будет назначено переменной _LINE_, имя_файла - это необязательный параметр,
который переопределяет значение _FILE_.
Директива #pragma позволяет передать компилятору некоторые
указания. Например, строка
говорит о том, что в программе на языке Си имеются строки на языке
ассемблера. Например:
Рассмотрим некоторые глобальные идентификаторы или
макроимена (имена макроопределений). Определены пять таких имен: _LINE_,
_FILE_, _DATE_, _TIME_, _STDC_. Два из них (_LINE_ и _FILE_) уже описывались
выше. Идентификатор _DATE_ определяет строку, в которой сохраняется дата
трансляции исходного файла в объектный код. Идентификатор _TIME_ задает строку,
сохраняющую время трансляции исходного файла в объектный код. Макрос _STDC_
имеет значение 1, если используются стандартно - определенные макроимена. В
противном случае эта переменная не будет определена.
В языке Си для IBM-совместимых персональных компьютеров
обращение к регистрам микропроцессора Intel 8086 осуществляется с помощью
специальных объектов, называемых псевдопеременными. Полный список
псевдопеременных включает 21 элемент: _АХ, _ВХ, _СХ, _DX, _CS, _DS, _SS, _ES,
_SP, _ВР, _DI, _SI, _AL, _AH, _BL, _ВH, _CL, _СН, _DL, _DH, _FLAGS. Их имена
образуются из имен регистров с префиксом _ (например, переменная _AX связана
с регистром AX). Первые двенадцать псевдопеременных и последняя имеют тип
unsigned int, а оставшиеся восемь - unsigned char. Присвоение значения
какой-либо переменной, например _АХ, вызывает занесение этого значения в
регистр АХ. Получение значения переменной, например _ВХ, эквивалентно
получению значения из регистра ВХ.
Рассмотрим примеры программ,
в которых используются различные конструкции языка Си. Первый из них
демонстрирует использование управляющих символов n в функциях
printf( ) и scanf( ).
Результаты работы этой программы имеют вид:
Значение n1 определяет число введенных цифр, а n2 - число
выведенных символов в строке x = 234 (с пробелами).
Следующий пример показывает использование спецификаций %[], а также
символов * и #.
Результаты работы программы имеют следующий вид:
Здесь пользователем введена строка Comp-1-2-3-4-5. Из нее только
четыре символа (Comp) совпадают с первыми символами, заданными в квадратных
скобках рассматриваемой спецификации [Computer]. Поэтому только эти
четыре символа попадут в первую строку, а оставшиеся символы (1-2-3-4-5)
попадут во вторую строку. Число n1 определяет минимальную ширину поля
для вывода, а число n2 = 3 - количество цифр после запятой. В результате
число 12.345678 будет смещено относительно левой границы, и после запятой
будут выведены три цифры. Шестнадцатеричное число 0х100 выведено функцией
printf( ) с префиксом 0x, без префикса 0x и в десятичной форме.
Третья программа демонстрирует использование условного оператора
if...else и оператора for для организации цикла.
После ее запуска на весь экран будет выведен символ X.
Новая библиотечная функция clrscr( ) имеет следующий прототип:
Она выполняет очистку экрана и объявлена в заголовочном файле conio.h.
Четвертая программа демонстрирует использование рекурсивной функции
для вычисления факториала. (Отметим, что определение функции factorial( )
может находиться и после функции main( ), но в этом случае функция
factorial( ) должна быть объявлена перед функцией main( ), т.е. до main( )
необходимо поместить строку: long factorial(int);.)
Результаты работы этой программы:
Пятая программа подсчитывает число символов и слов во вводимых
строках (новые символы и слова суммируются с предыдущими; пробелы входят
в число введенных символов).
Результаты работы этой программы:
Следующая группа программ демонстрирует работу с файлами. Она
позволяет организовать в файле на диске телефонный справочник и выполняет
следующие функции:
Ниже приведен текст головной программы main.c:
С помощью директив #include в головную программу включаются файлы:
my.h, findt.c, choicet.c, addt.c и subt.c. Считается, что все они находятся
в корневом каталоге диска A:. Если это не так, то необходимо изменить
соответствующие директивы #include. В файле my.h определены глобальные
переменные и некоторые символьные значения.
Файл my.h, в частности, определяет, что телефонный справочник будет
организован в каталоге tel диска A:. Поэтому необходимо перед запуском
программы main.exe создать этот подкаталог либо использовать другой подкаталог.
В последнем случае необходимо изменить строку:
которая задает имя файла с телефонным справочником (tel_num.txt).
Модуль findt.c, текст которого приведен ниже, содержит функцию
Find( ) для поиска строки str в файле tel_num.txt.
Модуль choicet.c содержит функцию Choice( ), позволяющую проверить
есть ли заданная строка в файле tel_num.txt.
Модуль addt.c содержит функцию Add( ), которая добавляет заданную
строку в файл tel_num.txt.
Модуль subt.c содержит функцию Sub( ), которая удаляет заданную
строку из файла tel_num.txt.
Ниже приводится возможный сценарий работы с программой main.
Последняя программа showt.c позволяет вывести на экран содержимое
телефонного справочника.
(c) Курсков С.Ю., составление, 2006-2012
|