blog/source/_posts/git-file-view.md

248 lines
6.3 KiB
Markdown
Raw Normal View History

2023-10-26 11:19:35 +08:00
title: 从文件看Git
tags: []
categories: []
date: 2023-10-26 11:15:09
---
# 从文件看Git
从一个提交代码说起
## 初始化仓库
为了了解Git我们先创建一个本地仓库
```bash
git init .
```
创建完成后,会有一个.git文件夹打开后如下
```bash
tree .git
---------------
├─hooks
├─info
├─objects
│ ├─info
│ └─pack
└─refs
├─heads
└─tags
```
一个标准的git仓库有hooksinfo, objectsrefs这几个文件夹同时还有configdescriptionHEAD几个文件。
这里先不介绍这些是什么,我们先提交一个文件看看
这里先创建一个test.txt文件并写入一段文本
```txt
这是第一个文件
```
使用git status查看当前仓库的状态
2023-12-05 13:42:32 +08:00
![image](https://static.lianglianglee.com/assets/image-20231023162908-77wvd7b.png)
2023-10-26 11:19:35 +08:00
可以看到一个新增文件,这个时候.git目录没什么变化
## 添加文件
接下来,我们需要使用 git add 命令将文件加入到暂存区再看git状态
2023-12-05 13:42:32 +08:00
![image](https://static.lianglianglee.com/assets/image-20231023163048-1qbqrle.png)
2023-10-26 11:19:35 +08:00
使用tree命令看一下目录
```bash
├─hooks
├─info
├─objects
│ ├─e1 这个是多出来的
│ ├─info
│ └─pack
└─refs
├─heads
└─tags
```
多出来一个文件夹,去看看这个文件夹是什么东西
2023-12-05 13:42:32 +08:00
![image](https://static.lianglianglee.com/assets/image-20231023163209-iri6tvb.png)
2023-10-26 11:19:35 +08:00
一个无后缀的文件,打开后,是一个乱码
2023-12-05 13:42:32 +08:00
![image](https://static.lianglianglee.com/assets/image-20231023163309-3bjxq3y.png)
2023-10-26 11:19:35 +08:00
这类文件可以使用 git cat-file 打开,打开这个文件,需要将两个字符的文件夹也给加上,这里就是`e1cfd5c071a3098ba096bc37300a003f0f3f036e`
2023-12-05 13:42:32 +08:00
![image](https://static.lianglianglee.com/assets/image-20231023163527-bo6ez6n.png)
2023-10-26 11:19:35 +08:00
可以看到这里是就是文本的内容
检查文件,在.git会多出来一个index文件这个文件打不来从字面意思可以看到是索引文件
## 提交修改
我们使用快捷的提交命令
```bash
git commit -m"第一次提交"
```
查看目录objects中又多了两个文件夹同时还有一个logs文件夹出来了
```bash
├─hooks
├─info
├─logs
│ └─refs
│ └─heads
├─objects
│ ├─c8
│ ├─d4
│ ├─e1
│ ├─info
│ └─pack
└─refs
├─heads
└─tags
```
我们同样使用git cat-file查看objects下的文件
第一个文件类似一个目录介绍里面是我们add时的那个文件和文件名
2023-12-05 13:42:32 +08:00
![image](https://static.lianglianglee.com/assets/image-20231023164251-hjinoiu.png)
2023-10-26 11:19:35 +08:00
另一个文件是commit的一些信息提交人邮箱时间等其中 tree这一行就是刚刚的文件。
2023-12-05 13:42:32 +08:00
![image](https://static.lianglianglee.com/assets/image-20231023164404-thcflji.png)
2023-10-26 11:19:35 +08:00
这里就可以把整个提交流程串起来了
git add 将文件生成一个快照,保存起来
git commit 为什么会生成两个文件,还不知道为什么,我们等会再添加一个文件看看
最少我们知道其中一个文件存放着提交人之类的信息。
这时通过这一串ID可以把整个仓库串起来
2023-12-05 13:42:32 +08:00
![image](https://static.lianglianglee.com/assets/image-20231023170406-ghlsodf.png)
2023-10-26 11:19:35 +08:00
我们再加一个文件test_bak.txt这里同样的add和commit
```bash
├─hooks
├─info
├─logs
│ └─refs
│ └─heads
├─objects
│ ├─0b
│ ├─26
│ ├─83
│ ├─c8
│ ├─d4
│ ├─e1
│ ├─info
│ └─pack
└─refs
├─heads
└─tags
```
又多了几个文件夹。使用git cat-file看看
```bash
# 第一个文件
D:\Learn\git_test>git cat-file 83911b459aa2a958469f2213ea842b5a196822c7 -p
这是第二个提交
# 第二个文件
D:\Learn\git_test>git cat-file 26e3e29b97b603085b7c0132a24a62f499666c1a -p
100644 blob e1cfd5c071a3098ba096bc37300a003f0f3f036e test.txt
100644 blob 83911b459aa2a958469f2213ea842b5a196822c7 test_bak.txt
# 第三个文件
D:\Learn\git_test>git cat-file 0bf7f5a2d147e2ae936b248246bc77cce97bb97b -p
tree 26e3e29b97b603085b7c0132a24a62f499666c1a
parent c8cf08ad9b3d1ffd6de33dfb5976bb4535a2c488
author 李亮亮 <wb-lll538609@cainiao.com> 1698050920 +0800
committer 李亮亮 <wb-lll538609@cainiao.com> 1698050920 +0800
第二次提交
```
从这里的第二个文件看这里甚至包含了第一个文件。在commit信息中又多了一行parent
这个时候,关系链变成了这样:
2023-12-05 13:42:32 +08:00
![image](https://static.lianglianglee.com/assets/image-20231023170924-eeck5wr.png)
2023-10-26 11:19:35 +08:00
到这里基本确定了objects的存储方式。既然是一个树那怎么知道根节点是哪个呢
我们可以一个一个翻文件夹
在`.git/refs/heads/master`文件夹存放着一个ID这个ID就heads文件夹下对应分支的最新的commitID
还有一个问题git怎么知道你在哪个分支呢这个时候可以看.git目录下的HEAD文件这里是一个引用指向了`refs/heads/master`​。
# 其他文件夹
我们第一个提交后多出来一个logs文件夹我们回过头看看这个文件夹都是什么
```bash
├─logs
│ └─refs
│ └─heads
│ └─master
│ └─HEAD
```
可以看到同样有一个HEAD文件还有一个master文件用文本编辑器打开
```bash
0000000000000000000000000000000000000000 c8cf08ad9b3d1ffd6de33dfb5976bb4535a2c488 李亮亮 <wb-lll538609@cainiao.com> 1698050405 +0800 commit (initial): 第一次提交
c8cf08ad9b3d1ffd6de33dfb5976bb4535a2c488 0bf7f5a2d147e2ae936b248246bc77cce97bb97b 李亮亮 <wb-lll538609@cainiao.com> 1698050920 +0800 commit: 第二次提交
```
第二列可以看到是一个ID后边就是commit相关的内容而这个ID就是存储commit信息的ID
第一列是上一个commit的ID。
---
index无法用文本管理器打开怎么知道存储的是什么呢
其实git中提供了命令可以看到index的文件
```bash
git ls-files --stage
100644 e1cfd5c071a3098ba096bc37300a003f0f3f036e 0 test.txt
100644 83911b459aa2a958469f2213ea842b5a196822c7 0 test_bak.txt
```
* 第一列 文件权限和类型
* 第二列 对象哈希
* 第三列 执行权限
* 0 未变更或已提交
* 1 已修改未暂存
* 2 已暂存
* 3 文件冲突
* 第四列 文件路径
---
接下来就是以老项目为例,一个一个解析
...